极客时间-轻松学习，高效学习-极客邦

姜姜
2020-12-18
dirty_background_ratio/dirty_background_bytes: 当dirty pages超过设置值时，系统才主动开始将脏页刷到磁盘。 dirty_ratio/dirty_bytes: 当dirty pages超过该设置值时，系统会将当前所有dirty pages 全部写入到磁盘，这个过程会阻塞write()调用。请问老师: 关于dirty_background_ratio/dirty_background_bytes，在刷脏页到磁盘的过程中，是否也会阻塞当前的write()调用呢？还是由另一个后台线程执行刷盘的工作？是每隔一段时间刷一次吗？还是一直刷到dirty pages小于dirty_background_ratio/dirty_background_bytes了才停止？课后思考题: 因为开启了"-direct=1"，采用非 buffered I/O 文件读写的方式，所以过程中不会产生脏页，但是I/O的性能会下降。
作者回复: @姜姜好问题！如果dirty page的数目超过dirty_background_ratio/dirty_background_bytes对应的页面数，会有一个kernel thread把dirty page写入磁盘，这样不会阻塞当前的write()。这个kernel thread会一直刷到dirty pages小于dirty_background_ratio/dirty_background_bytes对应的页面才停止工作。
15
威
2020-12-25
您好老师，想请教一下，perf能观察到哪个函数占用的cpu时间比较多，为什么还需要用ftrace来观察函数调用的时间呢；另外ftrace统计的时间，是指cpu时间，还是墙上时间呢？
作者回复: @威很好的问题。 perf看到的函数占比是采样比例，有可能是函数调用的次数多。而ftrace可以看到单个函数的调用时间。这里的时间值是wall-clock time
8
良凯尔
2020-12-16
有两个疑问：（1）节点可用内存是指这个节点的内存总量吗，还是剩余可分配量（2）容器里的这个比值A，是等于 dirty pages 的内存 / 节点可用内存 *100%吗，还是说等于 dirty pages 的内存 / 容器可用内存 *100%。（3）当节点上和容器里的/proc/sys/vm dirty page 相关内核参数配置了不同的值，会以哪个值为准呢
作者回复: (1) 这里的可用内存可以理解为"free" 命令输出的"available" 内存。 (2) 是等于 dirty pages 的内存 / 节点可用内存 *100% (3) /proc/sys/vm/dirty_*, 在容器和宿主机上是一样的，这个值没有namespace.
共 4 条评论
7
Geek8819
2020-12-18
12G，ratio 20%，1GB内存的这个case，我理解是，该case，即便是性能低，但是也没使用超过了dirty page的上限，为了说明dirty_ratio的设置不是性能低的原因 "然后再记录一下容器程序里每写入 64KB 数据块的时间，这时候，我们就会看到，时不时一次写入的时间就会达到 9ms，这已经远远高于我们之前看到的 200us 了。因此，我们知道了这个时间的波动，并不是强制把 dirty page 写入到磁盘引起的。" 对于这一段话不是很懂，和上面的12G，ratio 20% 的例子有何关系呢？如果是控制变量法，感觉不太合理啊，dirty_page的使用量没超过上限的话，不影响，但是超过了设置的上限，就一定不影响吗？这个case是不是应该保持dirty_bytes的数量很大？
作者回复: @Geek8819 这个例子中后来是把dirty_bytes值设置小了，让它对write()操作产生了影响。只是这个影响产生的9ms等待时间要远远高于我们之前看到的200us。这样只是说明，200us的延时不是dirty_bytes的配置引起的。 echo 8192 > /proc/sys/vm/dirty_bytes echo 4096 > /proc/sys/vm/dirty_background_bytes
共 3 条评论
5
fuyu
2020-12-16
文章中的工具分析是在宿主机还在容容内？
作者回复: 你指的是ftrace和perf？在宿主机上运行的。
共 2 条评论
2
谢哈哈
2020-12-19
结果应该是一样的，因为使用的是DIO
作者回复: 有测试数据吗？：-）
1
Helios
2020-12-21
Memory cgroups限制的内存算上了page cache
3
北国骑士
2022-06-15
在调用do_try_to_free_pages回收内存的时候，如果page是脏页，应该是会刷脏页的，为啥不把do_try_to_free_pages里面的操作进一步截图分析出来？可能就是刷脏引起的呢，另外，如果不是刷脏页引起的，为啥不分析下 do_try_to_free_pages 耗时高的原理是什么呢，里面到底进行了什么操作导致耗时长呢？感觉分析得不彻底啊。另外，对于定位不是刷脏页引起的例子也不是太懂，感觉不是太合理。
共 1 条评论
2
罗峰
2021-08-24
可以这么理解吗，这四个阈值参数是没有namespace的，所以容器和宿主机都是一样的值。但是统计容器的内存脏页比例是使用k8s的request memory limit。那么假如没有设置limit，那比例应该怎么算呢？按照宿主机的内存来算吗
多选参数
2021-08-12
老师，这里有个问题，就是 dirty 相关的参数也会限制容器里的吗？比如我 dirty_background_ratio 是 10%，容器的 memory 限制是 1GB，那么容器里的 dirty page 到达 1GB*10% 之后，内核 flush 也会把 dirty pages 写入磁盘吗？还是说 dirty 相关的参数只限制全部的内存使用？