25 | 容量场景之二:缓存对性能会有什么样的影响?
第四阶段分析
场景压力数据
拆分响应时间
- 深入了解
- 翻译
- 解释
- 总结
本文深入介绍了系统持续压力测试中出现的性能问题,并对问题进行了详细分析和优化。作者首先展示了在持续压力下TPS下降的情况,然后对响应时间进行了拆分分析,发现所有业务的响应时间都增加了。通过全局监控数据发现了CPU资源使用较高的节点,并对该节点进行了详细的监控数据分析。从中得出了系统中断数较高、context switch 达到了3万左右以及syscall消耗的CPU占比较高等问题。文章还介绍了对中断数据、软中断数据和网络队列的分析,以及对接口执行时间和Redis慢查询的跟踪分析。最后,文章还提到了在持续压力测试中出现的新问题,如TPS不稳定和Redis容器异常等情况。通过详细的案例分析和解决方案,为读者提供了解决系统性能问题的实用思路和方法。 在容量场景中,作者解决了多个问题并给出了结论:TPS能达到1700。通过分析压力工具参数化、数据库索引、资源争用、网络争用和Redis的AOF等问题,最终得出了系统整体容量的结论。文章强调了性能优化是无止境的,并提出了课后思考题,引导读者深入思考性能项目的重要性和如何判断系统优化到最优状态。整体而言,本文为读者提供了系统性能问题分析和解决的全面指南,帮助读者更好地理解和解决类似问题。
《高楼的性能工程实战课》,新⼈⾸单¥59
全部留言(8)
- 最新
- 精选
- jy问题: 1、“分析了资源争用,解决了多容器跑到一个节点上的问题。”,多篇文中都有移到另外一个work,这只能手动移? 2、“在之前部署系统的时候,我们把 SkyWalking 采样率设置得非常低,只有 5% 左右,目的为了不让 APM 影响性能和网络”,请问下这个在哪设置呢? 3、第四个阶段后,怎么没有核对tps是否复合业务比例? 4、第五个阶段后,怎么没有核对最大容量时tps是否复合业务比例? 谢谢老师
作者回复: 1, 是的。我这里没有做自动触发。 2. skywaling的配置文件中。 3. 我设置的时候就已经确定了。 4. 同上。
2021-07-1622 - sky_you看到了老师的很多优化思路,我觉得没有多年知识的积累是很难做到这种程度的。解析思路很重要。 同时在实际的项目中,性能工作的展开也没有那么顺利。比如我现在遇到的。开发就不怎么配合,我说代码有问题,提出代码在多线程的情况下要做相关的优化。开发缺不懂我在说什么。可能我技术还不到家,不能直接帮他改代码。结果就导致了问题没有办法解决。
作者回复: 性能问题的解决一方面靠的是能力;另一方面就是配合了。 对不配合的只能拿职位来压制。😊😊
2021-06-171 - Only look at me请教一下老师,这个第五阶段的增加线程,我们应该如何判断增加多少线程合适呢?
作者回复: 这个根据前面的执行数据,看一下tps对应的资源使用率就可以大概计算出来。
2023-02-03归属地:广东 - Geek_c1b445请问老师: 看截图好像是每个接口按接口统计比例去配置的吗? 前面章节好像说得按照业务配置吗?比如下单业务由登陆、查看商品、支付3个接口组成一个T配置到混合场景吗?
作者回复: 是的。设置不同级别的T。
2022-07-09归属地:北京 - zwm网络队列是不是升带宽也可以?
作者回复: 看情况,是带宽的问题,升带宽才可以。有些不是带宽阻塞的,而是应用阻塞的。
2022-02-09 - zwm1 没有结论就没有价值。但是有个疑问,我们现在做的性能测试的结论比较多的是两个,1是最大TPS(不看资源) 2是卡响应时间2s看性能情况,这也算是结论吧 2 先解决一个,每次只优化1个点 3 资源使用较高,TPS长期稳定?这个问题不太清楚,,,
作者回复: 1,给出tps和响应时间也算是结论,这是性能测试项目的结论中必须有的。 而对性能瓶颈来说,这个不算是结论,只是现象。 2. 那必须的。 3. 看趋势图。
2022-02-09 - 🏹引用“接着,我们登录到 Redis 服务所在的 worker 节点,查看日志:” -------老师这个是看的linux系统的系统日志吗? dmesg | more 是这个吗?
作者回复: 是的。
2022-01-31 - Geek_Gabriel上节课,我们经历了三个阶段的分析优化,分别解决了在压力线程不变的情况下,TPS 随时间增加而增加的问题,还有数据库加索引的问题。 这儿的TPS应该是ART吧.上一节中提到了tps下降,art上升的问题。
作者回复: 对。这里应该是响应时间,手抖了。我修改一下。可以联系我领5元纠错红包。
2021-07-04