• Realm
    2018-09-08
    1 监控是若干个局部,单独采集、分析、展示;追踪是全局视角,有链的上下游传递的概念,通过某个id串联相关的监控;
    2 诊断故障一般从链上分析出现问题的点,然后定位到点上的监控数据,看具体原因;

    作者回复: 嗯

    
     14
  • topsion
    2018-09-15
    胡老师,微博个人主页刷半天才能出来?为啥现在还没修复?
    
     9
  • 郁
    2018-09-08
    要是结合docker,不用侵入式的追踪系统就完美了

    作者回复: mesh思路可以

    
     7
  • 拉欧
    2018-09-08
    两者的维度不同:服务追踪系统关心的是单次调用的性能,这其中可能跨越多个服务;服务监控系统关心的是单个服务的性能,主要包括服务质量,甚至机器性能等指标;
    两者是互为补充的关系,服务监控系统可以及时发现服务内部出现的问题,但是所有服务运行正常,不代表跨服务调用一定正常,因为网络本身就是不可靠的,所以需要服务追踪系统发现服务之间可能出现的问题,这样对于系统的监控才算完备
    
     7
  • Liam
    2018-09-08
    一般排查bug都是从整体到局部,分布式链路追踪就是从整体把握业务执行的的过程,定位问题的区域后再具体分析,监控系统会收集每个节点的数据,包括日志,性能,资源,异常等,根据这些数据进一步定位问题的原因
    
     6
  • 何磊
    2018-09-09
    日志上报的阶段是不是在rpc的四个过程中都应该上报?比如在ss阶段,由于服务端挂了,没有响应数据。那么这次rpc调用就无法查询了?
    
     4
  • 楼下小黑哥
    2018-09-10
    相同:
    1.整个流程一致。


    不同:
    数据采集维度不一样。监控采集单个服务或整个业务详细业务数据,而追踪系统采集是调用链路过程中调用埋点数据即非业务数据。
    展开

    作者回复: 对的

    
     3
  • 弥朵
    2018-09-09
    请问什么是埋点呀
    
     3
  • 云中漫步
    2018-09-08
    一直不太懂,微服务怎么把一个交易组装起来,怎么编排,调用哪些服务。希望能得到这方面的知识。^_^
    
     3
  • kane
    2018-10-30
    我们团队当前也有这个痛点,我们的解决办法是:1.在调用链的源头生成TraceID,每个微服务在处理请求的时候将相关信息打印到日志文件2.通过ELK进行日志收集,可以在elk里进行traceid的检索。这样每次检索就把一次调用处理的所有日志都显示出来,提高问题定位的效率。对于老师讲的内容主要有两个问题,1.日志主动上报,会不会对微服务的资源有比较大的消耗呢?特别是比较频繁的调用处理。2.服务调用的耗时怎么计算的,没太看懂。

    作者回复: 主动上报采用udp方式对性能影响可以接受,另外服务调用的耗时也可以靠上报调用耗时来统计

    
     1
  • 波波安
    2018-10-13


    相同之处有系统的搭建都需要数据采集,数据处理,数据存储和数据展示这些步骤

    不同之处是服务监控系统主要监控局部的业务数据和日志,服务状况等。服务追踪系统是全局链路的一个调用跟踪。一般与业务无关

    展开
    
     1
  • 丢
    2018-09-10
    回复何磊“日志上报的阶段是不是在rpc的四个过程中都应该上报?比如在ss阶段,由于服务端挂了,没有响应数据。那么这次rpc调用就无法查询了?”
    服务端挂了,客户端会收到异常,还是可以在cr阶段上报

    作者回复: 对,客户端等到超时或者异常,就会记录下错误上报

    
     1
  • asdf100
    2018-09-10
    1.在每个请求涉及的四个点都要收集数据并上报,这样在原始业务代码里写上报代码是不是耦合性太强了?
    2.假如其中一个调用超市未返回数据,导致多次调用都无法收到服务端的返回信息,如何处理?
    
     1
  • 铂金小猪
    2018-09-08
    链路不是http呢?

    作者回复: 也可以的,就是埋点采集的代码不同

    
     1
  • 钟杰
    2019-10-24
    服务追踪主要是发现故障点,服务监控数据用于找出什么原因导致这个故障点发生故障
    
    
  • 杨恒连
    2019-07-22
    容器现在已经很厉害,所有的追踪都在容器化这一层做了处理
    
    
  • godtrue
    2019-05-22
    好东西呀😄
    我们好像没有这个,有调用链的追踪也是进程内的,而且使用起来也不太方便。

    正如其他同学回答的,监控系统的关注点在局部,凡人视角。追踪系统的关注点在全局,上帝视角。

    关注局部是为了了解更多的个体信息,关注整体一般是为了定位瓶颈看谁最慢。

    单机性能压测时通过监控系统能了解单机的最佳性能,以及机器的各种性能指标,可以针对单机的性能瓶颈进行优化。

    全链路压测时,如果有分布式的性能追踪系统,那定位性能瓶颈就方便多啦!
    展开
    
    
  • gongxt
    2019-03-14
    老师列举的似乎都是侵入性太强的工具,有没有其它方法呢?
    
    
  • gongxt
    2019-03-14
    相同点:
    1、都有采集端(agent)进行独立上报
    2、服务端收到数据都会对数据进行聚合计算,原始值的存储。这里不同的存储服务有不同的实现
    不同点:
    1、业务不一样,链接追踪主要针对请求链路进行处理,监控主要是针对服务内的业务指标包括不限于指标,日志等
    2、实现方式不一样,监控是时间序列数据库(基于lsm),而trace就不是了(应该是基于树)
    展开
    
    
  • 饭粒
    2019-03-11
    监控是对某种对象(功能,接口,硬件资源)的特定性能指标的监测,数据采集的过程可以不侵入业务代码。
    追踪是对服务整个RPC调用关系链的追踪,采集数据一般要通过在业务代码埋点获取。
    
    
我们在线,来聊聊吧