Linux 性能优化实战
倪朋飞
资深 Linux 专家,Kubernetes 项目维护者
87256 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 65 讲
结束语 (1讲)
Linux 性能优化实战
15
15
1.0x
00:00/00:00
登录|注册

21 | 套路篇:如何“快准狠”找到系统内存的问题?

思考
性能优化
内存性能问题
性能分析

该思维导图由 AI 生成,仅供参考

你好,我是倪朋飞。
前几节,通过几个案例,我们分析了各种常见的内存性能问题。我相信通过它们,你对内存的性能分析已经有了基本的思路,也熟悉了很多分析内存性能的工具。你肯定会想,有没有迅速定位内存问题的方法?当定位出内存的瓶颈后,又有哪些优化内存的思路呢?
今天,我就来帮你梳理一下,怎样可以快速定位系统内存,并且总结了相关的解决思路。

内存性能指标

为了分析内存的性能瓶颈,首先你要知道,怎样衡量内存的性能,也就是性能指标问题。我们先来回顾一下,前几节学过的内存性能指标。
你可以自己先找张纸,凭着记忆写一写;或者打开前面的文章,自己总结一下。
首先,你最容易想到的是系统内存使用情况,比如已用内存、剩余内存、共享内存、可用内存、缓存和缓冲区的用量等。
已用内存和剩余内存很容易理解,就是已经使用和还未使用的内存。
共享内存是通过 tmpfs 实现的,所以它的大小也就是 tmpfs 使用的内存大小。tmpfs 其实也是一种特殊的缓存。
可用内存是新进程可以使用的最大内存,它包括剩余内存和可回收缓存。
缓存包括两部分,一部分是磁盘读取文件的页缓存,用来缓存从磁盘读取的数据,可以加快以后再次访问的速度。另一部分,则是 Slab 分配器中的可回收内存。
缓冲区是对原始磁盘块的临时存储,用来缓存将要写入磁盘的数据。这样,内核就可以把分散的写集中起来,统一优化磁盘写入。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文详细介绍了如何快速准确地找到系统内存的问题,并总结了相关的解决思路。文章首先回顾了内存性能指标,包括系统内存使用情况、进程内存使用情况和Swap的使用情况,并强调了缺页异常的重要性。其次,介绍了常用的内存性能工具,如free、top、ps、vmstat、cachestat、cachetop和sar等,并指出了这些工具与内存指标的对应关系。最后,提出了两个表格,分别从内存指标和性能工具两个维度出发,列举了哪些性能工具可以提供哪些内存指标,以及这些常见工具能提供的内存指标。通过这些工具和指标的对应关系,读者可以更快地利用工具找出所需的性能指标,从而更有效地解决内存性能问题。文章还总结了快速分析内存问题的思路,包括使用free和top查看系统整体的内存使用情况,使用vmstat和pidstat查看一段时间的趋势,以及进行详细分析,比如内存分配分析、缓存/缓冲区分析、具体进程的内存使用分析等。最后,提出了内存调优的重要性和常见的优化思路。整体而言,本文内容丰富,提供了丰富的内存性能分析工具和方法,对读者解决内存性能问题具有指导意义。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Linux 性能优化实战》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(53)

  • 最新
  • 精选
  • allan
    老师,您在文中说到: 常驻内存是进程实际使用的物理内存,不过,它不包括 Swap 和共享内存。 但是在下一篇答疑的文章中提到:RSS 表示常驻内存,把进程用到的共享内存也算了进去。 这是不是矛盾了,是不是这一篇中说到的有问题呢?

    作者回复: 很细心呀,这里概念上和工具给出的指标有些出入,实际使用时要注意工具给出的指标的含义

    2019-01-14
    26
  • 减肥的老郭
    老师好,文中提到的bcc相关的工具都需要版本较高的内核,但是真实生产都无法满足这个要求,有别的替代工具么?

    作者回复: 有的,比如内存泄漏使用valgrind、动态跟踪使用systemtap等。这些工具相对来说更难用一些

    2019-01-07
    19
  • 无名老卒
    老师能不能举一些实际的例子,我是有遇到过线上内存泄露的案例,每次出现这个问题时,基本上是无解,因为基本上都是直接宕机了。这个可有监控方法? 其他的内存使用上的问题,如缺页、缓存数据用得过多等异常,基本上没有遇到过,这类问题,老师遇到的次数多吗?

    作者回复: 可以把系统和进程的内存指标监控起来,这样根据历史趋势就可以知道是哪些进程内存泄漏了。 其他的这些也有,但比较少。实际进程基本上都有一个内存管理模块,统一管理内存。有问题也是这个模块刚开始写的时候比较多,后面就会逐渐稳定起来。

    2019-01-07
    7
  • 深蓝
    我现实中遇到一个奇怪的场景 free -m 查看 used 很高 free buff/cache 都很低 top命令看不到内存占用高的内存,目前系统中可用的工具只有pmap top ps slabtop 请问老师有什么思路来排查这个问题

    作者回复: top有没有按照内存排序?

    2019-07-16
    3
    5
  • DJH
    倪老师,我们有一个空闲的docker节点(CentOS 7.4,只有k8s node组件,ceph组件和2个空跑的测试pod),平常只有几十的磁盘iops,每隔若干天后系统磁盘的iops就会持续超过3000,并且降不下来。经过iostat检查发现磁盘读写来自于swap卷,奇怪的是系统空闲内存很多,swap使用率也只有一点点(不到1%),主机上也没什么业务。现在每次碰到这个问题只能重启一下解决。请问这种问题有啥解决思路吗?

    作者回复: 可能跟NUMA配置有关,可以查下是不是允许跨NODE

    2019-01-07
    3
  • 平安喜乐
    例如:mysql 内存占用较高 怎么分析 MySQL 进程具体内存耗用呢?谢谢!

    作者回复: 这在官方文档上就有的 https://dev.mysql.com/doc/refman/8.0/en/memory-use.html

    2019-03-13
    2
    2
  • 沙漠风暴
    老师好,我们公司生产服务器上面内存使用率总是99%,我用top命令查了,是tomcat站点的java进程的VIRT是15G,RES是5G,机器总物理内存15G,这个VIRT是不是太高了,是什么原因导致的呢,会影响机器和tomcat的性能吗?谢谢指教!

    作者回复: VIRT高没事的,内存使用率高是不是还有其他的进程?或者多进程?

    2019-07-28
    1
  • 让熊猫飞上天
    你好,老师,问一下工具valgrind使用时在分析内存泄露时,这个工具不能直接使用pid来定位,只能跟程序文件吗? 感觉没有memleak这个好用

    作者回复: 是的,但是 memleak 内核版本要比较新,valgrind 在很旧的内核上也可以用

    2019-02-26
    1
  • Charlescliff
    老师,如果是swap缓慢的增长该如何分析呢,每天几十M的速度,sar vmstat几乎看不到si so,程序跑了一个月增长了一个g swap

    作者回复: 上监控系统,各种内存指标增长的趋势是可以看到的

    2019-01-08
    1
  • 群书
    大佬 线上环境发现有内存泄漏 怎么处理

    作者回复: 请参考第18篇

    2019-06-17
收起评论
显示
设置
留言
53
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部