17 |可靠性意识:可靠性Oncall十大原则
白园
你好,我是白园。
Oncall 作为可靠性的第一道防线尤其重要。今天我以 Oncall 为例子,结合我自己的职业生涯的重大的转折和收获,以及周围影响巨大的事件、故障,总结抽象成 10 条原则分享给你,帮助你养成可靠性意识。
原则一:态度决定命运,我们需要保持积极的心态
我一开始入职百度的时候由于刚从学校毕业一切都不太适应,而可靠性工作、运维工作是一项非常琐碎的工作,也容易让人反感、抵触。Oncall 的时候心态也是悲观、抗拒的。最终在第一次绩效也是收获了第四档(差的一档),晋升也没有通过,这个也是我工作中第一次低谷。
当时想离职或者内部转岗,不过我最终还是思考了一下,下定决心从哪里跌倒必须从哪里站起来。首先就是从心态做起,Oncall 的时候不再抱怨和抗拒,转而变成了抱着争口气的心态,做好每件事情。而坚持下来的结果也是好的,后续得到了快速的晋升,也完成了一次自我的蜕变。
这次事件也是我人生道路上从学校进入社会之后学到的第一堂课。很多事情并不是看起来那么难,在任何事情面前都需要保持一个积极的心态。什么是积极的心态,乐观、热情、皮实 / 耐挫。稻盛和夫提出一个理念:人生工作的结果 = 思维方式热情能力,热情是一切的源动力。埃隆·马斯克说过一句话,宁可要错误的乐观,也不要正确的悲观。董宇辉在多次演讲也反复提到要有一个皮实的心态。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
1. 保持积极的心态对于工作和个人发展至关重要,态度决定命运。 2. 养成补位意识,即使不是直接负责的问题也要积极推动解决,这对个人职业发展有积极影响。 3. 始终将用户的利益放在首位,通过有效沟通建立信任,减少不确定性带来的恐慌和不满。 4. 在Oncall之前做好详细的准备,包括保证快速感知问题、找到合适的人处理问题、掌握处理方案和节奏等。 5. 严格规范Oncall过程,包括定期巡检、每天的日报总结和沉淀、快速响应等。 6. 避免同时处理多个重要任务,专注于单一任务,直到完成,然后再转向下一个,是提高工作质量和保障系统稳定性的有效策略。 7. 杜绝侥幸心态,充分的准备和预防措施是避免灾难性后果的关键。 8. 不要轻易放过任何一个异常,及时调查和处理异常情况,避免潜在的问题和故障。 9. 不要隐瞒错误,及时、准确地分享信息非常关键,有助于快速定位问题,减少不必要损失。 10. 培养一种开放、坦诚的沟通文化,对于提高团队的响应能力和整体效率至关重要。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《SRE 实践:服务可靠性案例课》,新⼈⾸单¥59
《SRE 实践:服务可靠性案例课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论