• 黄楚门的世界
    2019-01-29
    一次io性能问题
    数据写es,运行一段时间后,发现写入很慢,查io时发现,读的io很高,写的io很少,很奇怪只写数据还没查询,读的io使用率基本接近100%。
    用iotop定位到es一些写的线程,将线程id转成16进制,用jstack打印出es的堆栈信息,查出16进制的线程号的堆栈。发现原来是es会跟据doc id查数据,然后选择更新或新插入。es数据量大时,会占用了很多读的io.
    后面写es就不传id,让es自动生成。解决了问题。

    作者回复: 👍 思路清晰。大家也可以参考分析 es 或者其他类似的问题

     1
     33
  • Ender0224
    2019-01-30
    老师,如何判断磁盘是在 顺序读 还是 随机读?
    ---
    可以使用strace把系统调用都找出来,write是否连续就可以看到了.

    作者回复: 是的,或者使用 blktrace 观察

    
     5
  • ninuxer
    2019-01-28
    打卡day31
    满满的套路,一心只想放假,无心上班,还得熬一周😂

    作者回复: 趁着有时间正好学习😊

    
     5
  • 每天晒白牙
    2019-01-29
    【day31打卡】
    老师的课程好用心,准备这些案例都会很费时,讲了心法,接下来就是我们自己在工作中的实战了,总之这个课很值。谢谢老师

    作者回复: 谢谢支持

    
     3
  • 我来也
    2019-01-28
    [D30打卡]
    套路了解了.
    其实查找其他方面的问题也都是这样啊.一步一步缩小范围.
    首先,确定有没有瓶颈产生,或者有哪方面的瓶颈.
    其次,看是谁导致的.
    再次,是谁操作什么导致的.
    最后,结合实际,给出解决方案.
    展开

    作者回复: 是的,都是一样的套路,关键是要知道每一步该怎么做,又为什么这么做。实际上最终的优化还要综合考虑成本和收效。

    
     3
  • Darrykinger.com
    2019-08-24
    我是一名开发者,当初公司刚刚成立,项目上线,那一次版本上线记得使用是更改了表的结构,然后系统在请求一个api以后,系统的top各种指标都达到了峰值,导致了机器直接死掉,重启以后,再请求,仍旧会宕机,当初没有看学习这个课程,然后,就各种百度,google,整体的思路想想和现在差不多,api请求以后,建立的那个进程的占用的内存,io都会很高,根据那个id ,记得使用lsof ,看到系统就一直在频繁的调用一个c语言函数,咨询了 相关的c/c++工程师,然后结合php的语言(业务是用php写的)函数的封装,最后找到了那个php函数,再找到上层自定义函数,然后发现是由于数据库的一个表的列的默认字段设置为了null,导致一个死循环,最终,将这个mysql的表的字段的默认值修改后,发现问题就迎刃而解了。。印象特别的深刻,虽然是开发,但是喜欢linux。。。各种编程语言离不开服务器的底层(linux服务器) 现在系统的学习linux以后,遇到问题就不会那么慌乱无助,现在想想,知其然不知其所以然(以前参加过一个比较基础的linux培训,重点是操作),对以后的职业发展真的不利! 收益斐然,多谢!
    展开

    作者回复: 谢谢支持,很高兴专栏可以帮到更多的人

    
     2
  • xfan
    2019-01-28
    想听老师的网络部分了,

    作者回复: 快了 😊

    
     2
  • vvccoe
    2019-01-28
    倪老师,你好。
    能详细说明一下IOPS吗?
    1.100 IOPS 是指的一秒内,能处理100次IO请求,这个请求包含了寻道定位数据吗?
    2.一次请求是不是只包含了4K的数据量,如果一次操作是9K 会拆成3次IO请求。

    作者回复: 1. IOPS就是 I/O per second 的缩写,指的是发送给磁盘的读写请求数(注意这里是系统合并后发给磁盘的)
    2. 每次请求的大小不是固定的,所以才会有 IOPS 和吞吐这些不同的指标

    
     2
  • DJH
    2019-01-28
    沙发。。。
    
     2
  • hola
    2019-02-23
    套路篇总是价值1个亿

    作者回复: 😊 谢谢

    
     1
  • 划时代
    2019-01-28
    打卡总结,快放假了,依然不能停下前进的脚步。

    作者回复: 👍

    
     1
  • Geek_Frank
    2019-11-26
    头绪太多,不过老师真的很用心,感谢
    
    
  • 饭粒
    2019-09-07
    价值满满套路篇。
    
    
  • lyonger
    2019-06-25
    老师好,我想请教一个问题:
       很多异常产生时是短时,那么过了以后没有现场可以分析了。比如io utils报警100%,但登陆机器上查看但时候可能已经没有现场,没法查到是哪个进程导致的。而我了解到sar命令可以查历史信息,但是好像sar -d 查磁盘的时候找不到是哪个进程。那么有更好的办法查询历史信息,或者保留现场的方式呢?

    作者回复: 嗯,是的,所以需要搭建监控系统,把这些历史数据记录下来(参考53、54篇)。

    
    
  • 如果
    2019-03-15
    DAY30,打卡
    
    
  • walker
    2019-02-18
    文件系统和磁盘的IOPS,响应时间,吞吐量有什么区别吗

    作者回复: 中间多了一层文件系统,文件系统也还有一层缓存

    
    
  • Orcsir
    2019-01-31
    Flag
    2019/01/31
    
    
  • 小老鼠
    2019-01-30
    第一表倒数第三行没找到blkparse命令

    作者回复: 是说 blkparse 命令安装后找不到吗?这是安装 blktrace 时自动就会带的

    
    
  • holen
    2019-01-30
    老师,如何判断磁盘是在 顺序读 还是 随机读?

    作者回复: strace 或者 blktrace 观察 I/O 是否连续

    
    
  • 挺直腰板
    2019-01-29
    老师好关闭了swap分区,还会有虚拟内存大小

    作者回复: 呃,不能学到I/O就忘记了内存呀😓。是时候回去复习下了

    
    
我们在线,来聊聊吧