超级访谈:对话张雪峰
张雪峰
前饿了么 CTO
14077 人已学习
新⼈⾸单¥59
登录后,你可以任选2讲全文学习
课程目录
已完结/共 18 讲
结课问卷 (1讲)
特别加餐 (1讲)
超级访谈:对话张雪峰
15
15
1.0x
00:00/00:00
登录|注册

12 | CTO的艰难时刻:差点引咎辞职

极客时间:你去饿了么也属于空降的领导,刚进去会遇到什么挑战吗?
张雪峰:其实大家都专心做自己的事,我是没有感受到所谓的火药味或防御性。第一天我担心是有防御性的,但我一直没有体会到,只体会到他们对技术的追求,所以刚开始团队这块倒没什么,我主要遇到的挑战就是宕机,2015 年那个夏天,我差点要引咎辞职,七月份各种故障纷至沓来。
极客时间:到引咎辞职这么严重吗?
张雪峰:宕机给我们造成的心理压力太大,那时候饿了么单量已经很大了,真是水深火热。我刚进去其实压力不大,因为我岁数大,大家都比较尊重我,Mark 也比较尊重我。但三个月后我也开始被他挑战,被他骂,骂得很有道理,就是我们团队做得不好。
七月份我们基本一周要宕机一次,有些感知得到,有些感知不到。那时候我基本都是最后一个离开公司,都过零点的,因为我要确保没问题,其实也是有点拖延时间,就想怎么样才能完全破解。
当时觉得挺对不起公司的,而且 Mark 一开始是骂,到后来他也知道,我比他更着急,他也不骂了。所以 15 年那个夏天我真有可能就离开饿了么,后来反正不知道脑子怎么抽了筋,最后也没有提交引咎辞职报告。
当时我进来半年,也招了一些同学进来,跟新老团队融合得还可以。如果我选择离开,那这些人怎么办?所以后来想想还是考虑兄弟之情,咬咬牙硬挺过去了。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

饿了么CTO张雪峰分享了公司面临的技术挑战和困难时刻,强调团队的乐观态度和解决问题的精神。他提到了2015年夏天饿了么频繁宕机给团队带来的心理压力,以及团队采取的补救措施和解决方案。此外,他还分享了在阿里出现的一次重大事故,以及对责任和管理的思考。这些经历展现了张雪峰在面对困难时的态度和对团队的担当。文章内容突出了技术领域的挑战和解决问题的思考,对读者了解技术团队面临的挑战和应对方式具有启发意义。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《超级访谈:对话张雪峰》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(9)

  • 最新
  • 精选
  • lesserror
    我也写了几年的PHP,想问一下雪峰老师关于饿了么用PHP遇到的一些坑,有写文章复盘总结吗? 觉得这块还是挺有意思的。

    作者回复: 内部复盘n次,wiki上不少内容,但对外分享(如:Qcon或公众号文章)印象中没有。2015年那个不堪回首夏天后,我们也逐步将PHP相关系统迁移或下线了。其实不止PHP(当年我们自认对PHP驾驭尚可),哪怕我们一直自认驾驭能力最强的Python/Java,一旦面临超高并发,都有可能出现各种意想不到突发情况。一言以蔽之:防火胜于救火。

    2021-11-14
    10
  • HarperMom
    想请问下关于RabbitMQ的巨坑是什么样的情况?

    作者回复: 这里展开不了,细节太多,建议先搜索「饿了么 RMQ 技术运营 徐盎 兰建刚」等关键字

    2021-11-11
    3
    6
  • 泰伦卢
    有问题为什么没追责测试呢,测试为什么没测出来?哪个工程师敢保证自己写的代码没问题呢?

    作者回复: 几方面原因: 1、访谈中有提到,root cause 来自一个开源组件 bug,非业务代码或自研框架 bug,QA/SDET 很难测到; 2、即使来自开源组件 bug,触发条件也比较苛刻,否则之前早就爆发了; 3、即使来自开源组件、即使触发条件比较苛刻,在这次爆发前也出现了端倪,负责这个开源组件同学(虽然是开源组件,按技术团队内部规定,也需要确定 owner)和另一位相关同学,在事后复盘时承认当时没引起足够重视:因为 bug 属温水煮青蛙类型,爆发需要一段累积时间,所以错过了最佳修复时间; 4、最终修复其实很简单:升级开源组件即可。而且事后复盘发现,即使不修复开源组件,也有其他 workaround 可以绕过去,就是麻烦一些。

    2021-12-04
    2
  • UncleNo2
    到底应不应该处罚一线工程师呢?

    作者回复: 见仁见智,怎么做都会引起波澜。就我经历而言,看团队不同阶段的一些核心变量是否有较大变化,如:味道、氛围、文化、业务规模、组织规模等。以饿了么为例,早期团队、主动(空降)引入团队、被动(被收购)引入团队等时期,核心变量都有不小变化。有较大变化,相应游戏规则(不止故障问责这么细的领域)就要随需应变。

    2021-11-15
    2
    2
  • 任国强
    管理细则方便公布吗,特别想看看怎么去定义这些规则

    作者回复: 细节主要PMO负责,宗旨就三点:1、可明确(one)owner;2、可量化(数字化或人肉皆可)评估;3、不可模棱两可,否则宁弃之。

    2021-12-28
    1
  • hao-kuai
    简单来说这个事情需要一个背锅的,但是不能是张老师,如果是张老师,那就意味着你的老大也有责任,为了“大局”体面只能牺牲工程师

    作者回复: 并不是,最终我的自请降级也执行了,而且我始终认为我要担主要责任(管理疏忽),不是简单的江湖义气。

    2021-12-01
    1
  • lisimmy
    任何时候主动承认错误没毛病,但是主动申请降级,有点拙了。会让上级觉得,你越权做决定、你没担当、没责任心、自暴自弃等的。 很简单,犯错了,承认错误,改正,尽力挽回损失。如果犯错了,申请降级,上级的心里可能会这么想:“怎么着,犯个错,就承受不了压力了?拔腿就跑不干了?你要降级,好,那么成全你” 个人见解,如有冒犯,见谅!
    2022-07-09
    1
  • 究竟是责任担当,还是江湖义气,感觉很多时候是分不清了。不过每个成年人都要为自己的行为负责,这是没错的。
    2021-11-29
  • 侯建坡
    坐在哪个位置都有自己的无奈。
    2021-11-16
收起评论
显示
设置
留言
9
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部