Linux性能优化实战
倪朋飞
微软资深工程师,Kubernetes项目维护者
立即订阅
23395 人已学习
课程目录
已完结 64 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (2讲)
开篇词 | 别再让Linux性能问题成为你的绊脚石
免费
01 | 如何学习Linux性能优化?
CPU 性能篇 (13讲)
02 | 基础篇:到底应该怎么理解“平均负载”?
03 | 基础篇:经常说的 CPU 上下文切换是什么意思?(上)
04 | 基础篇:经常说的 CPU 上下文切换是什么意思?(下)
05 | 基础篇:某个应用的CPU使用率居然达到100%,我该怎么办?
06 | 案例篇:系统的 CPU 使用率很高,但为啥却找不到高 CPU 的应用?
07 | 案例篇:系统中出现大量不可中断进程和僵尸进程怎么办?(上)
08 | 案例篇:系统中出现大量不可中断进程和僵尸进程怎么办?(下)
09 | 基础篇:怎么理解Linux软中断?
10 | 案例篇:系统的软中断CPU使用率升高,我该怎么办?
11 | 套路篇:如何迅速分析出系统CPU的瓶颈在哪里?
12 | 套路篇:CPU 性能优化的几个思路
13 | 答疑(一):无法模拟出 RES 中断的问题,怎么办?
14 | 答疑(二):如何用perf工具分析Java程序?
内存性能篇 (8讲)
15 | 基础篇:Linux内存是怎么工作的?
16 | 基础篇:怎么理解内存中的Buffer和Cache?
17 | 案例篇:如何利用系统缓存优化程序的运行效率?
18 | 案例篇:内存泄漏了,我该如何定位和处理?
19 | 案例篇:为什么系统的Swap变高了(上)
20 | 案例篇:为什么系统的Swap变高了?(下)
21 | 套路篇:如何“快准狠”找到系统内存的问题?
22 | 答疑(三):文件系统与磁盘的区别是什么?
I/O 性能篇 (10讲)
23 | 基础篇:Linux 文件系统是怎么工作的?
24 | 基础篇:Linux 磁盘I/O是怎么工作的(上)
25 | 基础篇:Linux 磁盘I/O是怎么工作的(下)
26 | 案例篇:如何找出狂打日志的“内鬼”?
27 | 案例篇:为什么我的磁盘I/O延迟很高?
28 | 案例篇:一个SQL查询要15秒,这是怎么回事?
29 | 案例篇:Redis响应严重延迟,如何解决?
30 | 套路篇:如何迅速分析出系统I/O的瓶颈在哪里?
31 | 套路篇:磁盘 I/O 性能优化的几个思路
32 | 答疑(四):阻塞、非阻塞 I/O 与同步、异步 I/O 的区别和联系
网络性能篇 (13讲)
33 | 关于 Linux 网络,你必须知道这些(上)
34 | 关于 Linux 网络,你必须知道这些(下)
35 | 基础篇:C10K 和 C1000K 回顾
36 | 套路篇:怎么评估系统的网络性能?
37 | 案例篇:DNS 解析时快时慢,我该怎么办?
38 | 案例篇:怎么使用 tcpdump 和 Wireshark 分析网络流量?
39 | 案例篇:怎么缓解 DDoS 攻击带来的性能下降问题?
40 | 案例篇:网络请求延迟变大了,我该怎么办?
41 | 案例篇:如何优化 NAT 性能?(上)
42 | 案例篇:如何优化 NAT 性能?(下)
43 | 套路篇:网络性能优化的几个思路(上)
44 | 套路篇:网络性能优化的几个思路(下)
45 | 答疑(五):网络收发过程中,缓冲区位置在哪里?
综合实战篇 (13讲)
46 | 案例篇:为什么应用容器化后,启动慢了很多?
47 | 案例篇:服务器总是时不时丢包,我该怎么办?(上)
48 | 案例篇:服务器总是时不时丢包,我该怎么办?(下)
49 | 案例篇:内核线程 CPU 利用率太高,我该怎么办?
50 | 案例篇:动态追踪怎么用?(上)
51 | 案例篇:动态追踪怎么用?(下)
52 | 案例篇:服务吞吐量下降很厉害,怎么分析?
53 | 套路篇:系统监控的综合思路
54 | 套路篇:应用监控的一般思路
55 | 套路篇:分析性能问题的一般步骤
56 | 套路篇:优化性能问题的一般方法
57 | 套路篇:Linux 性能工具速查
58 | 答疑(六):容器冷启动如何性能分析?
加餐篇 (4讲)
加餐(一) | 书单推荐:性能优化和Linux 系统原理
加餐(二) | 书单推荐:网络原理和 Linux 内核实现
用户故事 | “半路出家 ”,也要顺利拿下性能优化!
用户故事 | 运维和开发工程师们怎么说?
结束语 (1讲)
结束语 | 愿你攻克性能难关
Linux性能优化实战
登录|注册

51 | 案例篇:动态追踪怎么用?(下)

倪朋飞 2019-03-22
你好,我是倪朋飞。
上一节,我带你一起学习了常见的动态追踪方法。所谓动态追踪,就是在系统或者应用程序正常运行的时候,通过内核中提供的探针,来动态追踪它们的行为,从而辅助排查出性能问题的瓶颈。
使用动态追踪,可以在不修改代码、不重启服务的情况下,动态了解应用程序或者内核的行为,这对排查线上问题、特别是不容易重现的问题尤其有效。
在 Linux 系统中,常见的动态追踪方法包括 ftrace、perf、eBPF 以及 SystemTap 等。上节课,我们具体学习了 ftrace 的使用方法。今天,我们再来一起看看其他几种方法。

perf

perf 已经是我们的老朋友了。在前面的案例中,我们多次用到它,来查找应用程序或者内核中的热点函数,从而定位性能瓶颈。而在内核线程 CPU 高的案例中,我们还使用火焰图动态展示 perf 的事件记录,从而更直观地发现了问题。
不过,我们前面使用 perf record/top 时,都是先对事件进行采样,然后再根据采样数,评估各个函数的调用频率。实际上,perf 的功能远不止于此。比如,
perf 可以用来分析 CPU cache、CPU 迁移、分支预测、指令周期等各种硬件事件;
perf 也可以只对感兴趣的事件进行动态追踪。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《Linux性能优化实战》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(14)

  • 我来也
    [D51打卡]
    长见识了。
    还是先把perf 和 火焰图用起来吧。
    知道还有更好的工具在内核收集信息就行了。有需要了再来针对性的 看吧。🤦‍♂️
    2019-03-22
    2
  • lyonger
    老师,最近kvm虚拟机器,xfs文件系统下使用devmapper的驱动,每次使用docker跑任务ci build的时候,用iotop查看发现runner机器的[loop1]、[loop2]、[kworker/u32:2]的io 99%,任务中止了以后就没有发现异常了。我用perf定位到了热点函数是xfsaild、xfs_inode_item_push。用ftrace和trace-cmd要先知道运行的命令。那么2个疑问:
    1、有办法直接查看某个热点函数里的执行逻辑吗?在不知道执行什么命令的情况下,我只知道某个热点函数名称
    2、可以使用的探针有哪些,是怎么查看呢?

    期待您的回复,多谢。

    作者回复: 1. 可以先试试火焰图,然后跟着火焰图调用堆栈去查询内核源码。
    2. 探针的话,工具里面都提供了探针查询的命令,比如 perf list

    2019-07-10
    1
  • Geek_007
    老师你好,我在使用 perf trace 命令时发现,perf trace 追踪时,不能打印出打开文件的文件名,尽管我已经使用 perf probe 将filename 加入,但是依然无法打印出文件名。另外我使用 perf trace -e probe:do_sys_open ,依然还是记录所有的事件,请问老师,是我使用的有问题?还是其他问题?

    作者回复: 应该是 perf trace -e fs:do_sys_open

    2019-04-14
    1
  • xfan
    我想知道ebpf程序编写有什么好点的学习资源吗,有种心有余而力不足的感觉

    作者回复: 可以看到这个文档:https://docs.cilium.io/en/stable/bpf/

    2019-03-26
    1
  • ninuxer
    打卡day54
    整个动态追踪都比较懵逼,常用的也就是trace和perf很简单的用法,等啃完内核的书再回过头来看文章,估计容易消化点~
    2019-03-22
    1
  • Cloudfull
    老师 perf probe -a 添加自定义探针时 如何查看里面的 struct 类型的变量?
    2019-11-01
  • lyonger
    我昨天查到了问题根源,发现docker对于使用存储驱动有选择推荐的说明,那个问题是存储驱动问题导致,通过热点函数和调试发现改成overlay2后loop内核线程的io几乎没有了。业务也正常了。但是那2个问题,期待老师有空后给予解答,多谢。

    作者回复: 👍

    2019-07-11
  • manatee
    想请教下老师,在容器环境下使用以上动态追踪技术有哪些注意点和坑呢

    作者回复: 最主要的是调试信息问题,容器进程和依赖环境跟主机在不同namespace中,很多工具可能无法正确找出相应的符号表

    2019-06-06
  • cuikt
    高大上,内容干货多多。
    2019-05-10
  • 如果
    DAY51,打卡
    2019-04-19
  • york
    # perf probe -x /bin/bash -V readline
    The /bin/bash file has no debug information.
    Rebuild with -g, or install an appropriate debuginfo package.
      Error: Failed to show vars.

    这个问题怎么解?

    作者回复: 要安装debuginfo的,先网络搜索查查

    2019-03-28
  • 夜空中最亮的星(华仔)
    报道
    2019-03-26
  • cliff(亮剑)
    有没有讲Linux汇编和GDB的一期?

    作者回复: sorry,没有。这些更多的用在调试程序错误而不是性能优化中

    2019-03-24
  • ichen
    # perf probe
    perf: 'probe' is not a perf-command. See 'perf --help'.

    作者回复: 升级版本试试?

    2019-03-23
收起评论
14
返回
顶部