11 | 实战 2:基于可观测性数据进行问题分析和根因定位
翁一磊
你好,我是翁一磊。
在上节课的实战中,我为你介绍了如何采集一个微服务系统各方面的可观测性数据。收集好所有需要的数据之后,我们就可以在可观测平台方便地查看系统和应用软件的运行情况了。
这节课,我们就来看看在遇到问题的时候,怎么使用可观测性数据进行关联分析,定位到问题原因。
可观测性数据的联合
构建一个可观测系统的核心就是把丰富的数据关联在一起,比如我们需要知道一个访问请求的故障对应的日志是什么,同时它所在的主机(虚拟化环境)或是 Pod(容器环境) 的一些信息,以及它所依赖的中间件、数据库是否存在异常等等。
以前我们往往需要花费大量的时间成本人工在不同的监控、日志、管理系统中调取相关的 UI,即便使用一些工具实现了统一的数据展示,这个实施过程也非常非常复杂。
而观测云这个我们进行可观测性实战的平台,构建了完整的数据标签,也就是 Tag 的体系,而且保证了这些标签在整个系统中是唯一的 Key 且拥有一致性的表达。如: host, pod_name, trace_id, project, cloud_provider, status 等,这样我们在查询不同数据的时候,在构建相关的视图的时候,就可以获得完整的统一认知,也可以快速方便地构建不同数据直接的关联关系了。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
通过可观测性数据进行问题分析和根因定位是现代分布式系统中的重要技术。本文强调了构建可观测系统的核心是将丰富的数据关联在一起,以便在分析问题时有效地定位问题。作者从高基数、高维度和关联性的角度分别举例说明了可观测性数据的重要性。高基数数据能帮助定位问题的具体影响范围,高维度数据则能够赋予标签,形成多维度的数据,而关联性则能够建立数据相互之间的关联。文章还提到了建立 SLO 可观测,通过仪表盘持续跟踪 SLI 和 SLO 的状态,并设定监控器及时获取异常事件的告警。总的来说,本文强调了可观测性数据在问题分析和根因定位中的重要性,以及如何利用这些数据来提高系统的可靠性和服务水平。通过这些技术,读者可以更好地了解如何利用可观测性数据来发现和解决生产环境中的问题,提高团队效率。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《深入浅出可观测性》,新⼈⾸单¥29
《深入浅出可观测性》,新⼈⾸单¥29
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- Geek_fa3bb6所以把metric、log、trace关联起来的方法是什么?我更加希望深入讲解关联方法,而不是笼统带过,只介绍平台,我们要花钱要学的是内在的东西,这些平台类的讲解,我们自己看官网就好
作者回复: 关联是通过统一的标签体系。例如日志和链路,是通过 trace_id 进行关联。指标是也是通过标签,包括所在的主机或者容器,同时日志和链路也有这个标签,就可以关联到一起
2022-12-11归属地:上海29
收起评论