云平台宕机引发的系列思考,企业如何自救?
极客时间编辑部
讲述:杜力大小:2.18M时长:02:23
近两年,因为云平台宕机造成的事故数不胜数,尽管云平台会发生故障,但企业对云的信赖度依然很高。Gartner 研究主管曾表示,云服务市场的增长速度比几乎所有 IT 市场都要快。
在云之前,企业内部自建数据中心依旧会出现很多问题,不少问题甚至是致命的。不可否认,云确实解决了企业在计算、存储等方面的很多问题,但完全依靠云厂商提供安全性的做法是不可取的。
企业应该具备容灾意识,并在故障发生的第一时间采取措施弥补。因为云而产生的故障风险一般分为两类:因为误操作导致的问题和云平台故障导致的问题。
如果是误操作导致的问题,企业首先应该反问自己,如果不用云平台,解决方案是什么?常规的解决方案有定期备份归档策略,包括服务器、数据库、存储等。
在云计算环境下,平台基本都提供类似功能,例如服务器有快照,数据库和日志有备份等。这些功能都“实用性”地提供了解决方案,并且比自己构建的类似服务要简单好用,但很多企业为了节省成本,可能并没有接受云厂商的服务,此时就需要依靠企业自身的技术能力。
其次是权限问题,云平台的账户权限管理严格,避免无意或者恶意的误操作。
最后,通过堡垒机或者云平台自带的审计功能,至少知道发生故障时干了什么,怎么干的,这样恢复环境比较容易。
如果是云平台发生故障,企业首先应该保持正确的心理,毕竟只要是系统,都会发生故障。如果出现这种情况,那么走应急预案,用非系统的方式尽量降低风险。例如,某个服务宕机了,及时在官网做出声明。
另外,要分散风险。云环境的同城双活、异地灾备等方案基本就绪,尽量在经济和人员条件可行的情况下,使用这些分散风险的方法。如果故障只出现在一个服务器集群,采用异地灾备方案可以在最快时间切换到另一个集群,从而保持系统可用。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 勤劳的小胖子-libo相比原来有更多的选择
收起评论