26 | 全局监控(上):如何快速落地全局监控?
高楼

你好,我是高楼。
在第 7 讲中,我们已经讲解了如何设计全链路压测的全局监控。其中的主要逻辑是:

根据这个逻辑呢,我们可以得出下面这样的性能分析决策树:

为了实现对这个性能分析决策树中所有计数器的监控,我们要将需要监控的组件,一一对应监控工具。整体视图如下:

这张图其实我们前面也已经见过好几次了。从图里我们可以看出,这个项目中需要用到哪些监控工具。
这里你就要注意了,虽然我们选择了这些监控工具,但这只是因为这个工具相比其他工具,更多地覆盖了前面列出的计数器。但!并不是说,这些工具就覆盖了全部的计数器。
下面,我们就来看看这些工具到底能做哪些内容。因为全局监控的内容比较多,所以我会分两讲,挑选最为常见并且重要的几个组件为你拆解。这节课呢,我们的重点是拆解 k8s+docker 监控、操作系统监控和数据库监控。
Kubernetes+docker 监控
对于 Kubernetes+docker 的监控(以下简称为 k8s+docker ),主要的全局监控计数器如下所示:

为了实现对 k8s+docker 的全局监控,我希望能有工具可以把这些关键的性能计数器都展示出来,于是这里我选择了 cAdvisor+Prometheus+Grafana 的组合。如果你对安装部分感兴趣,可以参考上一讲《环境搭建:我们的系统是怎么搭建起来的?》。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

本文深入探讨了如何快速实施全局监控,重点围绕全链路压测的全局监控展开。作者首先介绍了全局监控的主要逻辑和性能分析决策树,然后详细拆解了k8s+docker监控、操作系统监控和数据库监控。针对k8s+docker监控,作者选择了cAdvisor+Prometheus+Grafana的组合来实现全局监控,并详细解释了其在节点资源总览、微服务资源总览和POD资源总览方面的应用。在操作系统监控方面,文章列举了监控套件中的CPU、内存、网络和系统部分的缺陷,并提出了自行扩展node_exporter的建议。对于数据库监控,文章以MySQL为例,介绍了使用Prometheus+Grafana+mysql_exporter套件实现全局监控的方法,并强调了慢日志分析的重要性。整体而言,本文以清晰的逻辑和实际案例,为读者提供了快速落地全局监控的方法和工具选择建议。文章内容丰富,涵盖了全链路压测的全局监控所需的各个方面,对于需要实施全局监控的技术人员具有很高的参考价值。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《全链路压测实战 30 讲》,新⼈⾸单¥59
《全链路压测实战 30 讲》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论