许式伟的架构课
许式伟
七牛云 CEO
84945 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 89 讲
许式伟的架构课
15
15
1.0x
00:00/00:00
登录|注册

47 | 服务治理的宏观视角

24小时不间断服务
软件需求
功能开发期的重要性
功能维护期的隐性成本
功能开发阶段成本
探索与发展
服务治理的复杂性
DCOS(数据中心操作系统)
虚拟机和容器技术
脚本的抽象化
自动化
单例用户支持
故障跟踪与排查
终端用户请求
软硬件环境故障
软硬件升级与配置变更
SRE的角色
人工介入与自动化
故障域管理
监控与报警
发布与部署
互联网对生活的影响
产品/功能生命周期
结语
服务治理的发展历程
服务治理系统的要求
故障源头
服务治理系统
服务治理的目标
服务治理的宏观视角

该思维导图由 AI 生成,仅供参考

你好,我是七牛云许式伟。

服务治理的目标

很多开发人员可能会习惯地认为,把软件开发出来交付给用户是其工作的结束。但实际上对于任何一个产品或者产品里面的某项功能来说,把东西开发出来只是个开始,实际上这个产品或功能在其被取代或去除之前,都会有很长一段时间的维护期。
上图是很基础的产品或功能的生命周期示意图。它并不只是对软件适用,而是对所有的商品适用。我们后面在 “软件工程篇” 中还会进一步探讨它。
对于这个示意图,我们核心需要理解的是两点:
其一,虽然功能开发阶段的成本是非常显性的,但是功能维护期,包括了功能迭代和售后维保,它的隐性成本往往更高。
其二,产品的功能开发期虽然有可能很短,但是它是起点,是源头。它每一分每一秒时间是怎么花的,很大程度上决定了这个产品或功能的最终维护代价。
互联网的诞生,对今天我们的生活产生了翻天覆地的影响。虽然细究起来它进入民用市场还只有短短二十多年的历史,但它的发展速度只能以 “恐怖” 来形容。
以互联网为载体的软件,它不只是在功能上要满足用户需求,还要提供健康的 24 小时不间断的服务。功能开发与维护的边界变得模糊,一些公司甚至每天都在发布新的版本。
要做到 24 小时不间断服务,这并不是那么容易的一件事情。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

服务治理是确保互联网软件能够24小时不间断提供服务的一系列管理和技术手段。本文从宏观视角探讨了服务治理的目标、系统和发展历程。作者指出,软件开发交付给用户只是一个开始,维护期的隐性成本往往更高。核心目标是确保软件能够真正做到24小时不间断的服务。在服务治理系统方面,涉及部署、升级、版本管理、监控与报警、故障域管理等内容。作者还介绍了服务治理的发展历程,从脚本自动化到基于物理机器资源的体系,再到虚拟机和容器技术的应用,最终实现了从手动触发到自主化的发展。文章深入浅出地介绍了服务治理的重要性和发展趋势,对互联网软件开发和运维的读者具有一定的参考价值。服务治理领域的探索与发展仍在不断进行,带来了解决方案的复杂性,但也为解决现实世界的复杂性提供了可能。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《许式伟的架构课》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(14)

  • 最新
  • 精选
  • Aaron Cheung
    数据中心操作系统后续会深入讲解吗

    作者回复: 会涉及

    2019-10-08
    4
  • Jeyrce.Lu
    老师我有个疑问希望你帮我解答一下,你在前边讲桌面端操作系统和服务端操作系统分道扬镳的标志是s3这类对象存储系统的出现。 但是对于运行进程的服务环境来说,我们今天使用docker,使用k8s这类虚拟化技术的确有了很大的便捷性,但是这存在一个前提:我们在linux安装docker和k8s,然后在k8s调度各种进程,网络服务,或者存储接口,所以本质还是在linux操作系统中需要安装k8s和docker软件,那么为什么没有人去开发一个专用于虚拟化环境的操作系统,这个操作系统直接安装在裸机之后就直接拥有了当前容器技术的所有特性,可以方便的组分布式集群,使用各种虚拟化功能呢?

    作者回复: 有这样的操作系统,coreos

    2022-04-02
    2
  • 靠人品去赢
    现在不是有一个发现服务的东西,发现服务提供服务,服务治理会不会比以前要轻松些。 还有就是docker和K8s,我知道k8s更好,但是又说不出来哪里好,实际上都是里面扔东西,我自己玩的话还是喜欢docker,毕竟一大堆现成的拿来直接玩,老师怎么看待这两者,K8S到底有什么过人之处呢?

    作者回复: 服务发现只是服务治理中的一个小点

    2019-10-08
    3
    2
  • Geek_88604f
    不太明白自主化具体是什么概念,是指具备人工智能吗?

    作者回复: 不是。我下一讲“云计算、容器与服务端的未来”重点会讲这个。

    2019-11-05
  • 技术修行者
    讲的真好,提个小意见,音频语速有点儿快,有时感觉像机器念的一样。
    2019-11-18
    6
    5
  • leslie
    Google SRE其实换到其它行业其对应的属性个人多年DBA&&OPS的经验感觉:其实现在已经不再是Google SRE的最初解释了,就像现在的OPS要做好OPS的事情其实至少应当具备DevOps或者全栈工程师的能力,近半年一直在极客时间去学习、反思、探索,其实现在的Ops应当是以过去的Ops为主且兼备全栈的能力,就像老师课程中所说的服务治理建立自治化系统。
    2019-10-12
    2
  • 不温暖啊不纯良
    第一次听到SRE(网站可靠性工程师)这个名字,我们做的是政务系统,一个系统上线到一个地方,都面临定制化开发的问题,于是就需要版本管理,但是地方上可能还会有更加具体的定制化,比如一个系统,要分为演示系统和实际应用系统两个版本,到最后一个市最多的时候出现过近40个不同版本. 但是统一版本的话也会有问题,就是我们的系统在不断更新新的功能,如果隔上一段时间后,再给某个原先的生产环境更新系统的时候会出现版本不一,致导致的应用问题. 关于版本过多维护困难,我能想到的解决方案就是增加人力资源;新版上线导致老版本无法正常运行,属于向下兼容没做好,需要在推进开发的时候,只做新增,不做修改或删除. 还有我对微服务具业务拆分也有问题,如果我们把用户认证做成一个单独的服务,来为其他服务服务,那么如果用户认证服务没有了,其他服务岂不是都用不了,不是要解耦吗?这个具体场景我还能理解,因为基础架构是业务架构的基础,就像是计算机硬盘用不了,那么其他建立在计算机上的应用都就用不了了.可其实我遇到最多疑惑的是,我们的业务之间不可避免的有关联,比如订单模块要关联商品模块,那么订单系统是否对要有能力独立,在其商品个模块挂了的情况下,依然可以查询订单的情况?我想是应该的,作为订单系统,自身有和其他业务重合地方,比如展示商品图片和价格.那么当我们订单模块要查询商品信息时,是否应该使用商品模块的查询接口而不是自己写一个查询接口? 还有我们部门昨天开了会讨论研发和实施(运维)的边界问题,讨论最多的问题就是实施人员和研发人员共识信息太少,既包含业务共识,也包含技术共识,研发这边的信息量明显可以碾压实施的信息量,导致每次解决线上都需要研发人员亲自动手,最后问题会花费成倍的时间,于是我建议,生产环境一个技术人员/开发环境一个技术人员.网站可靠性工程师,听起来更专业,名字里就诠释了他要做的事情.
    2021-05-12
    1
    1
  • ifelse
    学习打卡
    2023-09-18归属地:浙江
  • 张浩
    服务涉及的概念(可以理解为节点)很多,不同节点之间相互关联构成一个复杂的系统,而它又是一个自身动态持续迭代升级,与之相关的业务也在持续地迭代发展,导致复杂度持续升高,必然导致服务治理也更加复杂。服务自治是更好的解决方案。
    2021-05-23
  • 不温暖啊不纯良
    再谈谈对自动化和自主化的理解,自动化只是自动的做一些事情,这事对不对要人来判断,但自主化解决了一类线上系统面临的通用问题---硬件老化.将服务部署在物理环境,那就少不了要维护硬件和面临硬件带来的可靠性问题.自主化是说在虚拟环境部署系统,虚拟环境中的硬盘就不是指这个环境某个具体的硬盘,而是硬盘一堆硬盘,一个坏了立马自己替换一个.保证服务的可靠性.也就是这事对不对它自己知道.
    2021-05-12
收起评论
显示
设置
留言
14
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部