高楼的性能工程实战课
高楼
盾山科技 CEO,7DGroup 创始人
19172 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 35 讲
特别放送 (1讲)
结课测试 (1讲)
结束语 (1讲)
高楼的性能工程实战课
15
15
1.0x
00:00/00:00
登录|注册

24 | 容量场景之一:索引优化和Kubernetes资源分配不均衡怎么办?

你好,我是高楼。
我们知道,做容量场景的目的是要回答“线上容量最大能达到多少”的问题,这就要求我们在设计和执行容量场景的时候要非常严谨。当然,这也意味着容量场景将是一个艰辛的过程。通过这节课,你就能深切地体会到。
今天,我们重点来解决索引优化和 Kubernetes 调度不均衡的问题。关于索引优化,你可能会奇怪,基准场景都捊过一遍了,为啥还有要看索引的问题?是呀,确实让人疑惑。从这里就可以看出,容量场景和基准场景真的不太一样,因为这其中有业务相互影响的问题。
而 Kubernetes 调度不均衡的问题将导致多个 Pod 运行在了同一个 worker 上,像这样的问题,我们不在容量场景中是看不到的,希望能对你处理类似问题有一个借鉴。
此外,我们还将一起看看在压力稳定的情况下,响应时间不断攀升该怎么办。这种问题很常见,但是每次出现问题点都不太相同,这次你将看到一个具体的案例。
好,我们开始吧!

场景运行数据

第一次运行

不得不承认,第一次来到容量场景,还真是心惊胆颤的。
首先,我们小心翼翼地设置起容量场景的比例,也就是我们在第 5 讲中提到的业务比例,再设置好相应的参数和关联。然后,我们把容量场景跑起来,得到了这样的信息:
顿时就有一种满头包的感觉,有没有?!不过,“见招拆招,遇魔降魔”不就是我们的宗旨吗?既然有错,那咱们就先解决错误吧。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入探讨了容量场景中的索引优化和Kubernetes调度不均衡问题,并提供了解决方法。作者首先强调了容量场景设计和执行的严谨性,指出容量场景与基准场景的不同之处在于业务相互影响的问题。针对索引优化问题,文章提到了容量场景中可能出现的业务影响,需要重新关注索引的优化。此外,文章还讨论了Kubernetes调度不均衡可能导致多个Pod运行在同一个worker上的问题,并提供了解决方法。在文章的后半部分,作者通过场景运行数据的分析,介绍了在容量场景中解决问题的具体过程。通过多次运行容量场景,作者发现了脚本错误、组件问题以及远程调用超时等多种问题,并提供了相应的解决方案。整体而言,本文通过具体案例展示了容量场景中可能出现的问题及解决方法,对于需要进行容量场景设计和执行的技术人员具有一定的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《高楼的性能工程实战课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(2)

  • 最新
  • 精选
  • jy
    问题: 1、用相同的member_id登录,之前登录获取的token不会失效?为什么会存在一个用户的多个不同token呢? 2、文中:"在查看了全局监控数据之后,数据库的资源如下所示",这里为什么是数据库的资源?应该就是全局监控的结果吧 3、文中:”我们在前面提到,在拆分响应时间的过程中,发现是 Order 服务消耗的时间多。而 Order 服务又是当前这个场景中最需要资源的应用,那我们就先把 Auth、Portal 之类的服务移走。“移到其它worker?这些是不是物理机资源不足造成的?为什么不能一个服务就在一个worker上? 谢谢老师

    作者回复: 1. 同样的token。失效时间设置长一点即可。 2. 对。 3. 没有那么多的服务器。

    2021-07-16
    3
  • 1.为什么在压力线程不变的情况下,TPS 曲线下降、响应时间上升是不合理的? 答:因为压力线程不变时,如果出现曲线下降,响应时间上升,说明系统出现了无法及时处理请求的问题,对应会表现在一些服务CPU上升,或者消息堵塞等地方. 2.当资源使用过于集中的时候,如何定位 Pod 相互之间的影响?你有没有和这节课讲的不一样的招? 答:a.将服务分别移出 b.分别针对不同的服务进行压测 c.调整不同服务的cpu(就像之前调整ES的过程一样) 这些都类似与之前单服务压测时,快速排查时,针对某些节点扩容的思想 是不是也能通过查看一些日志来定位呢.但是对服务器这块的基础不太了解,稍后学会了再补上

    作者回复: 看起来是认真学习了哦。 理解的都很正确。

    2022-01-14
收起评论
显示
设置
留言
2
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部