微软蓝屏事件:如何应对变更带来的问题?
白园
你好,我是白园。
不知道你有没有被 7 月 19 日微软蓝屏事件影响到,可能国内大部分人没有,有一部分外资企业因为安装了 CrowdStrike 而受到了影响,而 CrowdStrike 就是这次故障的“罪魁祸首”。
这次的蓝屏事件涉及全球几千万 windows 用户,波及全球,银行、航空、超市等使用 windows 并安装了 CrowdStrike 软件的企业。
图片中的英文内容翻译如下:
7/18/24 10:20PM PT - 大家好,我们收到了关于 Windows 主机上出现蓝屏死机(BsOD)的广泛报告,这种情况发生在多个传感器版本上。我们正在调查原因。技术警报(TA)将很快发布。置顶帖子。
影响范围:EU-1, US-1, US-2 和 US-GOV-1
编辑 10:36PM PT - 技术警报发布:https://supportportal.crowdstrike.com/s/article/Tech-Alert-Windows-crashes-related-to-Falcon-Sensor-2024-07-19
编辑 11:27PM PT:
CrowdStrike 工程团队已经识别出与此问题相关的一个内容部署,并已撤销这些更改。
临时解决方案步骤:
1. 以安全模式或 Windows 恢复环境启动 Windows。
2. 导航到 C:\windows\System32\drivers\CrowdStrike 目录。
3. 查找匹配 “C-00000291*.sys” 的文件,并将其删除。
4. 正常启动主机。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. 微软蓝屏事件导致全球数百万Windows用户受影响,包括银行、航空、超市等企业,尤其影响安装了CrowdStrike软件的用户。 2. CrowdStrike的更新影响了大约850万台Windows设备,导致全球范围内的航空公司、银行、政府网络、企业、超市自动收银机等受到影响。 3. CrowdStrike作为一款安全软件,在内核级别运行,其变更导致Windows主机进入自动修复死循环状态,暴露了Windows操作系统在自我防护层面的缺失。 4. 应用程序视角下,解决变更带来的问题需要进行分级发布,充分评估、准备,并实施分级发布策略以最小化变更可能引起的风险。 5. 操作系统视角下,为确保操作系统的健壮性,需要实施资源隔离与限制、关键程序保护、异常检测与自我保护等关键措施。 6. 在本次案例中,操作系统应该及时把相关的应用程序进行降级和隔离,以限制影响在程序无法启动和运行,而不是让系统直接崩溃。 7. 发版是一种非常常见的变更场景,任何形式的变更都可能让一个系统从稳定状态转变为不稳定状态,因此需要谨慎评估和实施变更。 8. CrowdStrike首席执行官George Kurtz表示,这不是一起安全事件或网络攻击,相关问题已被识别、隔离,并已部署修复方案。 9. CrowdStrike是美国同名软件开发商开发的面向企业和机构的终端安全软件,主要提供端点安全防护、情报威胁和网络攻击防御等服务。 10. 企业应建立冗余系统、培训员工和演练应急预案、确保数据备份和恢复流程,以应对技术系统故障,保障业务连续运作。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《SRE 实践:服务可靠性案例课》,新⼈⾸单¥59
《SRE 实践:服务可靠性案例课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论