赞博主精辟剖析!谈谈个人思考:
巨大流量对稳定性指标的冲击其实是量变引发了质变。不管是软件工程还是线上运维其实自然是一体,谷歌SRE其实更是无边界支撑线上业务的模式的实践。
另外,这和谷歌技术文化底蕴也有很大的关系,毕竟谷歌的工程师都是万里挑一的优秀人才,追求极致甚至是从他们进入公司都会耳濡目染,举个例子一个borg系统都做了十几年,不断优化完善。
而近几年一直火热的DevOps理念侧重点是为了提高研发应该具备的综合能力,在不依赖与运维的基础上,能在软件设计上多考虑可运维性,所以由此来看这也应运而生产生更多辅助产品来保障核心业务,而随着辅助产品逐渐逐渐完善也就逐渐催生业界更多优秀的解决方案。
稳定性很多时候是“望天收”的情况,也许幸苦一年建设的稳定性基础设施还不如蓝翔一铲子厉害。所以,建设过程中会逐渐考虑软件层面的高可用,这也是软件定义运维的意义。
展开