• 餘生
    2020-01-20
    看完这篇文章的感觉就是,一个武林高手给了我一本100页的书,我以为就是秘籍的全部,原来只是目录

    作者回复: 这个比喻非常的恰当。如果要秘籍的全部,估计还要再写几个专栏。
    而做为我写的第一个专栏,我希望能授人以渔。

    
     3
  • 小老鼠
    2020-01-30
    老师好厉害,作了二十年测试还是没听懂,好专业。
    
    
  • 小老鼠
    2020-01-30
    监控工具运行在服务器端的,会不会影响系统的性能数据

    作者回复: 从极端的角度来说,每个监控工具运行在服务端都会对性能有影响。取的数据越多越影响。所以,我们的监控工具选择的时候,基本也使用和运维同样的工具。
    这样测试出现的结果也和生产一样了。因为生产上也是用这些监控工具来做的。

    
    
  • 律飛
    2020-01-19
    1.为什么要先有全局监控,再有定向监控?
    先全局监控,才能有全面系统的数据分析,避免遗失信息,能更快速有效的发现问题。
    通过分析全局、定向、分层的监控数据做分析,再根据分析的结果决定下一步要收集什么信息,然后找到完整的证据链,才能体现监控的价值。
    2.为什么不建议一开始就上代码级的监控工具呢?
    因为代码级的监控消耗资源,更重要的是,代码级监控数据很多,查看这些数据耗费精力,就像大海捞针,没必要像无头苍蝇乱撞。如果定位到它们有问题时再去监控、去看,更一针见血。
    展开

    作者回复: 这位同学已经完全理解我的意图,非常好。

    
    
  • 沃克
    2020-01-19
    最后4张图是用什么工具得出来的?

    作者回复: k8s的dashboard呀。
    最后一个是skywalking。

    
    
  • songyy
    2020-01-19

    思考题
    为什么要先有全局监控,再有定向监控:因为首先要从大方向上,找到瓶颈在哪里;再进入细节去分析,才比较有效率
    为什么不建议一开始就上代码级的监控工具呢:一上来就上代码级别的监控,一方面配置这些监控太耗时间,另一方面可能得到的数据,也用不上


    另外,我们公司用的是DataDog,可以给每个机器单独的top/ps命令的记录,我们公司从框架级别支持收集一些基本的数据(比如,一个GRPC耗时多久),把AWS的相关数据也都集中在这里,还可以设置起来对应的报警;感觉颇为好用
    展开

    作者回复: 挺好。工具可以让我们工作更有效率,原理让我们理解看哪些数据。

    
    
  • 土耳其小土豆
    2020-01-17
    全局监控是要先检查哪块出现性能问题、然后再抽丝剥茧、一层层的往下查找、这样能准确定位到问题的所在,不致于导致盲目的不知所措的为了找问题而找问题。不过不同的组件监控工具都不同吗?还是工具通用的、只是模版不同?

    作者回复: 基本没看到通用的监控工具。
    不同组件的计数器都不一样,也不可能有什么模板。

    
    
我们在线,来聊聊吧