深入浅出可观测性
翁一磊
观测云产品技术总监
4965 人已学习
新⼈⾸单¥29
登录后,你可以任选4讲全文学习
课程目录
已完结/共 18 讲
深入浅出可观测性
15
15
1.0x
00:00/00:00
登录|注册

01 | 以史鉴今:监控是如何一步步发展而来的?

你好,我是翁一磊。
这几年有一个新兴的概念在云计算时代下发展起来了,叫做可观测性。Gartner 在今年(2022 年度)的基础设施和运维自动化技术成熟度周期图里,把“可观测性”放在膨胀期波峰最顶端位置,可以说是风头正盛。
可观测性其实并不是一个新概念,它的英文是 Observability,这个词是由工程师鲁道夫·卡尔曼提出的。他在自己 1960 年的论文中,用可观测性来描述数学领域的控制系统。可观测性被定义为一种度量方法,这是控制论的一部分,可观测性意味着从系统向外部输出的信息可以推断出系统内部状态的好坏。
在这个概念进入到计算机软件领域前,我们其实是通过监控这种方式去保障系统整体的稳定性的。可观测性和监控并不是一回事,但二者也有着联系,所以在我们正式进入可观测性的讲述之前,先来一起看看计算机和监控软件的发展史。

单机电脑时代

最早的电脑大部分是单机运行的,还没有网络的概念。那个时候在操作系统层面就有很多的工具软件可以供我们观测操作系统的运行状态。
对于 Windows 用户来说,最著名的工具就是任务管理器了,而 Linux 也有一堆类似 Top、PS 的命令帮助我们知道操作系统的运行状态。一部分应用为了进一步方便我们排查问题,设计出了日志,它可以输出文本展示应用的运行情况。如 Windows 的事件关联,Linux 的 syslog 等。这个时期,我们是通过操作系统和应用本身的一些功能来了解并掌控系统的。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

监控技术的发展历程从单机电脑时代开始,随着互联网的兴起,监控需求也随之变化,促成了新一批监控工具的出现。这些工具支持标准的Internet协议,具有可扩展性,并且通常具有基于Web的界面。随着技术的不断发展,出现了一些新型监测工具的需求,如Splunk,它能更加完整地收集和分析处理海量数据。文章通过历史的角度,介绍了监控技术的发展脉络,从单机电脑时代到互联网时代,展现了监控技术的演进过程。移动互联网时代带来了全新的监控需求,包括日志分析、应用性能监控等产品的发展。随着互联网的不断发展,监控工具也在不断演进,从基础设施监控到应用性能监控,再到可观测性的概念,监控技术一直在与计算机和互联网的发展紧密相连。在商业世界中,各种监控厂商也在不断提供更全面的可观测能力。整个计算机监控和可观测性的发展史展现了技术与产品的不断演进,而可观测性的内涵和与监控的实质性差别也成为了下一步的讨论重点。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《深入浅出可观测性》
新⼈⾸单¥29
立即购买
登录 后留言

全部留言(9)

  • 最新
  • 精选
  • 张申傲
    监控工具用过很多,按照 Logging、Metrics 和 Tracing 三个方面说一下: -Logging:使用 ELK 搭建日志收集和查询平台;用 Sentry 作为异常日志的采集与告警。 -Metrics:使用 Prometheus 进行系统/业务指标的上报、存储与告警,并结合 Grafana 进行看板和报表展示。 -Tracing:使用 Skywalking 作为链路追踪和观测系统。 实际工作中的痛点:要想完备地监控一个大型的应用,需要同时搭建很多的中间件和平台,且每个平台都有一定的接入和配置成本,不同平台之间的功能还有重合。期望未来能有一个一站式的平台,类似 Java 领域的 SpringCloud 全家桶,只需要简单的配置就可以完成上面所有的观测需求。

    作者回复: 后面会有实战的课程,也会介绍一站式的平台

    2022-09-16归属地:上海
    11
  • Geek_fa3bb6
    用的比较多的是prometheus,它的好处是上手快,接入便捷,灵活的部署架构以及exporter扩展能力,可按需配置多维标签,并结合PromQL查询语句、Altermanager和Grafana可以快速架构起一个监控告警系统。它的缺点是自身没有集群化和水平扩展能力,需要结合Thanos等外部系统,以及它适合做metric监控,不适合做log和trace监控

    作者回复: 确实,你总结得很到位,Prometheus有便利的地方也有比较明显的局限

    2022-09-17归属地:上海
    3
  • Eason Lau
    沙发,依次使用过zabbix、falcon、CAT、prometheus、各种自研Trace和开源trace,但都是解决一个方向的

    作者回复: 你的实际经验很丰富,用过这么多工具,可以带着这些经验以及问题一起来学习,一起交流探讨

    2022-09-15归属地:上海
    3
  • 怀朔
    都在解决的如何快速定位的问题 ,不管是网络级别 应用级别 还是面对越来越复杂的软件系统 从对比 同比 环比到异常 从接口次数和频率 期待。

    作者回复: 欢迎加入一起学习!

    2022-09-15归属地:上海
    2
  • 申屠鹏会
    最早提出可观测性的是谁呢

    作者回复: 最早可观测性其实是在控制论中提出来的

    2022-09-16归属地:上海
  • R_R
    目前使用的是公司内部二次开发的时序数据库,结合Grafana可视化。 最痛苦的点在于对于SaaS场景需要进行租户隔离,报警的数据的维度是有限的,不能够上报所有的数据。 另外监控指标没有办法先屏蔽某一个维度,导致一个租户会影响整体的报警
    2023-10-23归属地:北京
  • 林十二XII
    移动互联网的下半场 Iot, 会面临更多的入网设备、五花八门的系统、难以泛化的部署场景. 全链路的监控体系, 一定会成为重要的一环. 赶紧学习一波 老师的课很细致, 感谢
    2023-07-21归属地:北京
  • Geek_42abae
    cat监控服务,prometheus监控基础设施,loki监控日志,听云监控用户体验,自研系统监控业务
    2022-11-09归属地:北京
  • 码小呆
    Prometheus ,Skywalking 都有使用到
    2022-09-21归属地:广东
收起评论
显示
设置
留言
9
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部