SRE 实战手册
从 0 到 1 带你搞定系统稳定性
赵成  蘑菇街技术总监
专栏
已完结·共 13 讲
|
1.3w 人已学
|
收藏

你将获得

  • 理解 SRE 的正确姿势
  • 10+ SRE 必学必会知识点
  • 可落地的故障应急处理机制
  • 2 种典型 SRE 组织架构案例分享

课程介绍

SRE(Site Reliability Engineering),网站稳定性工程,最早是由 Google 设置的一类工程师岗位,专职负责其超大规模分布式产品(如搜索、Gmail、Docs 等)的稳定性。而后,SRE 慢慢发展成了一系列面向稳定性的,包括技术、管理、流程、组织架构,以及文化建设的最佳实践,并最终被提炼成一套方法论,广泛流传。

在国内,SRE 的这套方法论,也被很多企业的 IT 团队作为技术能力提升和组织转型,特别是运维转型的参考标准。但是,在实际落地这套方法论时,大家有很多疑惑,比如:

  • SRE 如果不是运维的升级版,那它到底是什么?
  • SRE 涉及范围如此之大,到底应该从哪里入手建设呢?
  • 在稳定性方面,有些公司已经做了很多工作,特别是在技术体系搭建上,为什么还是故障频发?难道单纯的技术保障还不够吗?
  • 引入了 SRE,团队的能力应该怎么提升?组织架构应该怎么匹配呢?

因此,我们邀请赵成老师开设了《SRE 实战手册》这个课程。他将结合自己的实践经验,从基础理论和实践操作两方面入手,一次性解决你心中的困惑,帮助你正确认识 SRE,掌握可落地的实践方法。

这个课程分为基础篇和实践篇两大模块。

  • 基础篇:带你从实践的角度理解 SRE 是什么,并以 SRE 的基本概念 SLO 和 SLI 作为切入点,教你一步步建立起 SRE 稳定性标准。最后结合具体的电商案例,分享在实际场景中设定稳定性目标应该考虑的因素。
  • 实践篇:围绕“故障”这个影响稳定性的核心事件,分享故障发现、故障处理、故障复盘三个阶段的最佳实践。同时,着眼落地 SRE 时绕不开的组织架构问题,分享真实的组织架构设置实践和高效的跨团队协作经验。

课程目录

查看更多
免费试读

适合人群

有 1 年以上运维和开发经验的工程师,运维领域架构师,业务架构师,技术团队负责人。

不管你是否正在落地 SRE,只要你关注系统、业务或应用等的稳定性问题,这个课程都适合你学习。

特别放送

免费领取福利

订阅须知

  1. 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
  2. 本专栏为虚拟商品,交付形式为图文 + 音频,一经订阅,概不退款。
  3. 订阅后分享海报,每邀一位好友订阅有现金返现。
  4. 戳此先充值再购课更划算,还有最新课表、超值赠品福利等。
  5. 企业采购推荐使用“极客时间企业版”便捷安排员工学习计划,掌握团队学习仪表盘。
  6. 戳此申请学生认证,订阅课程享受原价 5 折优惠。
  7. 价格说明:划线价、订阅价为商品或服务的参考价,并非原价,该价格仅供参考。未划线价格为商品或服务的实时标价,具体成交价格根据商品或服务参加优惠活动,或使用优惠券、礼券、赠币等不同情形发生变化,最终实际成交价格以订单结算页价格为准。
讲师

赵成

蘑菇街技术总监

赵成,蘑菇街技术总监,《赵成的运维体系管理课》作者,运营公众号“成哥的世界”。他还是 ArchSummit 全球架构师峰会运维专题明星讲师和优秀出品人,TGO 杭州分会会员。赵成曾在华为工作七年,有丰富的电信行业软件研发及运维经验。 近两年,赵成和他的团队花了大量精力来做稳定性...查看更多
编辑推荐
讲师的其他课程
赵成的运维体系管理课
赵成
《进化: 运维技术变革与实践探索》作者

49讲 | 37841 人已学习

¥59¥129
包含这门课的学习路径

运维工程师

32门课程 149.1w人学习
看过的人还看了
深入剖析 Kubernetes
张磊
Kubernetes 社区资深成员与项目维护者

57讲 | 116750 人已学习

¥68¥199
MySQL 实战 45 讲
林晓斌
网名丁奇,前腾讯云数据库负责人

49讲 | 224923 人已学习

¥68¥199
左耳听风
陈皓
网名“左耳朵耗子”,资深技术专家

119讲 | 180989 人已学习

¥98¥399
数据结构与算法之美
王争
前 Google 工程师

81讲 | 283786 人已学习

¥68¥199
从 0 开始学架构
李运华
网名“华仔”,前阿里资深技术专家(P9)

66讲 | 152606 人已学习

¥68¥199
Linux 性能优化实战
倪朋飞
资深 Linux 专家,Kubernetes 项目维护者

65讲 | 87286 人已学习

¥68¥199