07 | 全栈监控:如何设计全栈监控策略?
高楼
你好,我是高楼。这节课,我们来看看怎样设计全链路压测的全局监控。
对于全链路压测来说,因为涉及到的服务比较多,所以分析逻辑难度加大,对监控的要求当然也更加复杂。
如果我们总是在性能瓶颈出现之后再去做分析,很可能会发现缺少各种数据。这时能做的就只有重新运行一遍场景,再增加监控工具,实现更多的数据采集,以补充分析逻辑中需要的数据。
但是这样的事情肯定是越少发生越好,所以在全链路压测场景执行之前,我们就要把监控策略考虑清楚。
怎么样来规划监控策略呢?跟着 RESAR 性能工程理念,我们从系统架构、性能分析决策树、全局监控几个方面来有节奏、有层次地思考一下。
系统架构
对于性能分析来说,我们要分析的是整个系统架构中,压测场景中涉及到的每一个技术组件,这些技术组件只有从架构的视角才能看得清楚。
从服务视角,我们可以知道需要监控的服务有哪些,保证服务的覆盖;从资源视角,可以让我们知道资源使用率应该达到多少才是合理的,同时资源视角也和容量模型有关,是重要的容量模型输入。
服务视角:
资源视角:
看到这样的系统架构,我们可不能只知道里面有几个框,还要清楚四点。
服务列表和调用关系。
这一点在系统架构的文档中应该有描述。举例来说,在我们这个系统中,当我们发起一个登录请求时,对应上面的架构就是:gateway - member - auth - mysql(redis)。了解了调用关系之后,等你要分析登录业务的性能时,就可以一层层剥离问题了。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
本文深入探讨了全链路压测性能分析决策树的复杂性和关键性。从系统架构、性能分析决策树、全局监控等方面展开讨论。首先,系统架构方面,文章提到了从服务视角和资源视角来分析整个系统架构,包括服务列表和调用关系、服务规模、硬件投入和技术栈等内容。其次,性能分析决策树方面,文章介绍了业务调用链和容量所需的资源的计算方法。最后,全局监控方面,文章强调了性能工程覆盖系统生命周期的重要性。通过系统化的思考和分析,为读者提供了设计全栈监控策略的方法和思路。全文内容可复用于任何性能项目中。全链路压测需要全面关注和准确性。监控工具和思路并未完全改变,而是在原有基础上叠加新组件和压测流量。全局监控对性能问题的定向监控分析起到关键作用。读者被鼓励思考性能分析决策树所需的技术背景和如何避免遗漏计数器,以及全局监控对性能瓶颈分析的作用。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《全链路压测实战 30 讲》,新⼈⾸单¥59
《全链路压测实战 30 讲》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(4)
- 最新
- 精选
- 张彦松性能分析决策树要求什么技术背景?如何才能做到不遗漏计数器? 技术背景:需要对技术架构,应用架构,部署架构比较熟悉,且对他们的原理,以及调用关系比较熟悉,才能理出来。 如何才能做到不遗漏计数器?基于对上面的熟悉,以及基于对压测需求的理解,业务特性的理解,借助性能分析决策树,逐步梳理出需要监控的核心指标,且后面有一个查漏补缺的过程。
作者回复: 看来是掌握了。
2023-08-29归属地:上海 - calaite老师,文章里面提及到一个 6C12G 的容器(这里指的是登录链路上的所有服务都有这样的硬件配置)中,700TPS 是稳稳的可以撑得住的。-----/这里的700TPS如何算出来的的!
作者回复: 不是算出来的,是测试出来的。
2022-07-11归属地:北京 - 宏请问架构图是怎么画的,还有监控的图表是从什么平台上下的呢?
作者回复: 自动生成的。
2022-06-25归属地:北京 - Geek_62d00d老师 技术组件中是不是应该也包含kafka呢,这个应该也要监控吧,还有es?
作者回复: 我们这里面没有用到kafka,如果用到的话,那必然也是要监控的。但是ES就要看一下是业务在用,还是监控在用了,如果是监控在用的话,那就必要对监控组件再加一层监控。
2022-02-10
收起评论