作者回复: 要么落实到流程、要么落实到工具和系统,不能依赖人
作者回复: 你要看下游有没有放大问题,注意是放大,而不是说出错,因为上游数据格式出错,正常来说下游肯定出错,只要没放大就没问题。
作者回复: 1. 这里讲的是线上问题复盘,事件触发模式,不需要定期举行。 2. 多大问题要追责,实行什么样的奖惩措施,是公司或者团队要预先制定规则的。 3. 看问题大小来复盘和追责,支付宝5.27全网宕机的事故,总裁都要担责。
作者回复: 被别人定责的时候,明确定责标准再根据标准找事实,基本上能够避免背黑锅。 你对定责的理解已经到了新的境界,点赞👍🏻 其实我也出过事单过责,但长期来看,关键还是自己成长,某次担责并不可怕,有时候担责反而让自己理解更深,印象更深
作者回复: 并没有很好的方法,更多靠个人的积累,如果遇到自以为是的产品或者运营,沟通很麻烦,我在阿里都遇到很多这样的产品,能力一般还很自信,开口闭口乔布斯、苹果之类的
作者回复: 1. 团队leader也要承担连带责任 2. 大部分公司以结果导向,即使需求文档没写,如果是正常需求需要考虑的,在设计和测试的时候都要覆盖,需求文档不可能事无巨细全部覆盖到。
作者回复: B的主责肯定是跑不掉,至于A是不是主责,要看A造成的问题大小。举个例子,如果A的问题只持续了1分钟就解决了,那不需要承担主责,如果A本身也导致了30分钟的问题,那么也是要承担主责的。
作者回复: 做事细致认真值得赞赏,但也不要过于谨小慎微。
作者回复: 很用心,记得保存在自己的笔记上
作者回复: 1. B主责,A次责。因为A没法做B的覆盖测试,只有B能够自己做,B没做好机型不够,本身就说明B有问题,这次是A的bug触发了,下次可能是其它原因导致B出问题。 2. 开发乱改测试不知道,那当然是开发的责任;开发正常写代码也给了测试,测试没测出来,那当然是测试的责任。否则如果每个问题都要求开发不出bug,那还要测试干嘛?干脆裁掉测试部门看看测试部门是否同意 :)