• zuozewei
    2021-05-29
    个人觉得容量保障属于运维 SRE 范围,即 SRE 性能事件快速响应,其特点是: 1)需要在短时间内解决问题 -快速决断为王。可以扩展,回滚,重定向流量等。 -必须应付压力,熬夜很正常。 2)系统之前处于“良好”状态 -需要快速发现不同于历史的曲线 3)需要立即得到所有干系人员的帮助 -必须具备社交性 4)可靠性和性能问题经常相关

    作者回复: 同意你的观点,在最权威的Google SRE实践中,基础设施的容量规划、容量治理和相关演练措施,以及应急响应等工作,都是SRE的重要职责范围。 不过,容量保障“不仅仅”属于SRE的范围,我们可以将SRE视为动车组的车头,相关的研发团队和测试团队等,视为动车组的挂载车厢。注意,动车组所有的车厢都是有动力的喔,并不是单靠车头去牵引的,车头的作用是指明方向。

    
    9
  • @李上网来⚡
    2021-05-21
    那简言之,质量保障说的是功能,容量保障说的是性能。

    作者回复: 理解到位!

    
    6
  • liubiqianmoney
    2022-02-20
    除了质量保障和容量保障,其实还有一个稳定性保障。稳定性保障聚焦MTTR和MTBF,在缩短MTTR方面需要做可观测(系统异常可及时发现,并支撑故障定位)、应急响应配套(有故障处理的工具、机制、预案)和事故复盘配套(有复盘工具、复盘方法、运营流程),在延长MTBF方面需要做多活容灾与弹力架构、故障演练、技术风险治理、变更管控。

    作者回复: 谢谢你的总结,稳定性保障确实是一个很重要的领域,而且和质量保障以及容量保障都有关联。

    
    1
  • 汤进贤
    2023-04-07 来自广东
    老师,目前公司处于发展初期,业务变化比较频繁,版本更新较快,是不是优先保障单服务单接口的性能,待业务稳定后再开始全链路压测的策略会比较适合当下?

    作者回复: 没错,这是一个合理的trade-off,在第15讲中我给出了更多方案,你也可以参考。

    
    
  • 牛减
    2022-02-19
    大佬能否也开一门 质量保障 的?

    作者回复: 感谢厚爱和支持,质量保障是一个big deal,它的涵盖面比容量保障更广,我,包括其他老师,也都会以各种形式输出一些质量保障的方法和看法(不一定是专栏,可能是每日一课或其他形式),你可以多多关注

    共 2 条评论
    
  • 于加硕
    2022-06-21
    喜欢最后一句话,基础知识促进思考力。
    
    
  • 77
    2021-05-24
    电力的breeze么?
    
    