Linux 性能优化实战
倪朋飞
资深 Linux 专家,Kubernetes 项目维护者
87256 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 65 讲
结束语 (1讲)
Linux 性能优化实战
15
15
1.0x
00:00/00:00
登录|注册

17 | 案例篇:如何利用系统缓存优化程序的运行效率?

对比CPU和缓存两个不同角度的分析思路,发现不同角度的分析可以全面了解系统性能
应用程序开发中,可以使用专门的缓存组件来进一步提升性能
可以使用cachestat和cachetop观察系统和进程的缓存命中情况
缓存可以提升系统的I/O性能,衡量缓存使用效率的指标是缓存命中率
优化应用程序,使用系统缓存,提升读取速度
发现应用程序使用了直接I/O,绕过系统缓存
使用strace观察应用程序的系统调用情况
通过cachetop和pcstat观察缓存命中情况
观察缓存命中率,发现第二次读取速度明显提高
使用dd命令测试文件的读取速度
pcstat:查看文件在内存中的缓存大小以及缓存比例
cachetop:提供每个进程的缓存命中情况
cachestat:提供整个操作系统缓存的读写命中情况
缓存模块通常提供查询接口,如cachestat和cachetop
高命中率表示使用缓存带来的收益越高,应用程序性能越好
缓存命中率是指直接通过缓存获取数据的请求次数,占所有数据请求次数的百分比
思考
总结
案例二:文件读写
案例一:dd命令
工具
缓存命中率
如何利用系统缓存优化程序的运行效率

该思维导图由 AI 生成,仅供参考

你好,我是倪朋飞。
上一节,我们学习了内存性能中 Buffer 和 Cache 的概念。简单复习一下,Buffer 和 Cache 的设计目的,是为了提升系统的 I/O 性能。它们利用内存,充当起慢速磁盘与快速 CPU 之间的桥梁,可以加速 I/O 的访问速度。
Buffer 和 Cache 分别缓存的是对磁盘和文件系统的读写数据。
从写的角度来说,不仅可以优化磁盘和文件的写入,对应用程序也有好处,应用程序可以在数据真正落盘前,就返回去做其他工作。
从读的角度来说,不仅可以提高那些频繁访问数据的读取速度,也降低了频繁 I/O 对磁盘的压力。
既然 Buffer 和 Cache 对系统性能有很大影响,那我们在软件开发的过程中,能不能利用这一点,来优化 I/O 性能,提升应用程序的运行效率呢?
答案自然是肯定的。今天,我就用几个案例帮助你更好地理解缓存的作用,并学习如何充分利用这些缓存来提高程序效率。
为了方便你理解,Buffer 和 Cache 我仍然用英文表示,避免跟“缓存”一词混淆。而文中的“缓存”,通指数据在内存中的临时存储。

缓存命中率

在案例开始前,你应该习惯性地先问自己一个问题,你想要做成某件事情,结果应该怎么评估?比如说,我们想利用缓存来提升程序的运行效率,应该怎么评估这个效果呢?换句话说,有没有哪个指标可以衡量缓存使用的好坏呢?
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入介绍了如何利用系统缓存来优化程序的运行效率。作者首先解释了Buffer和Cache的概念,以及它们对系统I/O性能的提升作用。然后,作者介绍了缓存命中率的重要性,并提供了cachestat和cachetop工具来查看系统缓存命中情况。通过实际案例和工具的介绍,读者可以更好地理解缓存的作用,并学习如何充分利用缓存来提高程序效率。文章还展示了如何利用工具来优化I/O性能,以及如何判断应用程序是否使用了直接I/O。最后,作者提出了一个思考题,帮助读者更深入了解缓存的原理。整篇文章通过案例分析和工具介绍,深入浅出地阐述了缓存对系统性能的重要性,为读者提供了实用的技术指导和思考方向。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《Linux 性能优化实战》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(128)

  • 最新
  • 精选
  • 我来也
    [D17打卡] 想不到Buffer 和 Cache还有专门的工具分析, 长见识了! 暂时只能在自己的机器上玩玩, 生产环境连root权限都没有,更别提升级CentOS内核版本了. ----------------- 关于思考题,我是这样想的: 出现性能问题时的症状可能并不是单一的. 比如这次同一个案例,从CPU和缓存两个不同的角度, 都是定位到了代码中的open. cpu角度分析的流程是: 1.top 看到了%iowait升高 2.dstat 看到了wait升高时 read同步升高. 说明跟磁盘相关 3.$ perf record -g ; $ perf report 定位到了跟磁盘相关的系统调用 sys_read(). new_sync_read 和 blkdev_direct_IO 定位到了跟直接读有关系. 4.查看代码 找到了跟磁盘相关的系统调用 open. 缓存角度分析的流程是: 1.进程5秒缓存命中率100%,但是只命中了1024次,推算使用缓存4MB.实际每秒0.8MB 2.看日志知道每次读取的是32MB.[实际也可以通过dstat vmstat等工具粗略推算出该值] 3.预期的32M与实际的0.8M相差甚远. 来找原因. 4.strace 查看系统调用 定位到了openat 及 直接给出了调用参数 O_DIRECT 5.查看代码 找到了跟磁盘相关的系统调用 open. ----------------- 个人总结: 顺藤摸瓜, 根据现像找本质原因. 磁盘io导致性能问题 -> 查看系统调用 -> 定位大致原因 -> 查看源码 -> 确定问题 还居然在完全不知道程序具体实现的基础上,定位到了引起性能问题的系统调用. 有的甚至还直接给出了参数,太牛了.

    作者回复: 总结的很好,其实两个思路都可以,不过具体实践时可能会受限于可用的性能工具

    2018-12-28
    3
    81
  • 黑客不够黑
    这里的direct i/o是不是上一节课里的直接操作磁盘的“裸i/o”呢?如果是的话是不是应该从buffer的角度分析实验二呢?

    作者回复: 不是的,直接IO是跳过Buffer,裸IO是跳过文件系统(还是有buffer的)

    2019-02-17
    6
    41
  • 念你如昔
    (我是小白) 1.dd命令前清理了缓存,为什么缓存命中率是百分之49.8呢?(都已经没有缓存了,按理说是0) 2.绕过了系统缓存,为什么缓存命中率还百分之百?

    作者回复: 1. 预读,2. 还有元数据缓存

    2019-01-04
    2
    28
  • Johnson
    dd命令也支持直接IO的 有选项oflag和iflag 所以dd也可以用来绕过cache buff做测试

    作者回复: 👍对的

    2018-12-28
    16
  • jssfy
    请问第一次读50%的命中率如何解释呢?

    作者回复: 预读

    2019-01-04
    8
  • 春暖花开
    非常有价值,是我阅读的极客课程里面最棒的。

    作者回复: 😊谢谢

    2018-12-28
    8
  • 往事随风,顺其自然
    要是centos验证一下就好了,不同系统很多问题不一样,操作上遇到问题很奇怪

    作者回复: 大部分案例我都在centos7验证了,不过文章中有些地方没有列出来详细的步骤,比如安装或者升级软件包的步骤,这些其实都是些基本功了。如果碰到实在无法解决的问题,请具体描述下。

    2018-12-28
    6
  • 辉晖
    很遗憾,实际生产环境都是用centos,没法为了安装bcc-tools而去升级内核。

    作者回复: 嗯嗯,也可以试试 systemtap

    2019-07-11
    2
    5
  • 许山山
    我也觉得这门课超级棒了,原理加时间,学到很多!

    作者回复: 谢谢👍

    2018-12-28
    5
  • Zyj-Sxy
    #go get方式安装pcstat可能会有问题直接下载github仓库就不用挂代理什么的了 #安装go yum install -y go #添加环境变量 cat << EOF >> /etc/profile export GOROOT=/usr/lib/golang export GOPATH=/root/go export GOBIN=$GOPATH/bin export PATH=$PATH:$GOBIN EOF #加载环境变量 source /etc/profile #使用git方式拉取 mkdir -p $GOPATH/src/golang.org/x && cd $GOPATH/src/golang.org/x && git clone https://github.com/golang/sys.git #使用git拉取pcstat, mkdir -p $GOPATH/src/github.com/tobert && cd $GOPATH/src/github.com/tobert && git clone https://github.com/tobert/pcstat.git #编译pcstat go install $GOPATH/src/github.com/tobert/pcstat/pcstat #安装完成就可以直接使用pcstat pcstat /bin/ls

    作者回复: 👍 谢谢分享详细的步骤

    2020-07-17
    2
    4
收起评论
显示
设置
留言
99+
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部