极客时间-轻松学习，高效学习-极客邦

Realm

2018-09-08

1 监控是若干个局部，单独采集、分析、展示；追踪是全局视角，有链的上下游传递的概念，通过某个id串联相关的监控；
2 诊断故障一般从链上分析出现问题的点，然后定位到点上的监控数据，看具体原因；

作者回复: 嗯



 14
topsion

2018-09-15

胡老师，微博个人主页刷半天才能出来？为啥现在还没修复？



 9
郁

2018-09-08

要是结合docker，不用侵入式的追踪系统就完美了

作者回复: mesh思路可以



 7
拉欧

2018-09-08

两者的维度不同:服务追踪系统关心的是单次调用的性能，这其中可能跨越多个服务；服务监控系统关心的是单个服务的性能，主要包括服务质量，甚至机器性能等指标；
两者是互为补充的关系，服务监控系统可以及时发现服务内部出现的问题，但是所有服务运行正常，不代表跨服务调用一定正常，因为网络本身就是不可靠的，所以需要服务追踪系统发现服务之间可能出现的问题，这样对于系统的监控才算完备



 7
Liam

2018-09-08

一般排查bug都是从整体到局部，分布式链路追踪就是从整体把握业务执行的的过程，定位问题的区域后再具体分析，监控系统会收集每个节点的数据，包括日志，性能，资源，异常等，根据这些数据进一步定位问题的原因



 6
何磊

2018-09-09

日志上报的阶段是不是在rpc的四个过程中都应该上报？比如在ss阶段，由于服务端挂了，没有响应数据。那么这次rpc调用就无法查询了？



 4
楼下小黑哥

2018-09-10

相同：
1.整个流程一致。

不同：
数据采集维度不一样。监控采集单个服务或整个业务详细业务数据，而追踪系统采集是调用链路过程中调用埋点数据即非业务数据。

展开

作者回复: 对的



 3
弥朵

2018-09-09

请问什么是埋点呀



 3
云中漫步

2018-09-08

一直不太懂，微服务怎么把一个交易组装起来，怎么编排，调用哪些服务。希望能得到这方面的知识。^_^



 3
kane

2018-10-30

我们团队当前也有这个痛点，我们的解决办法是：1.在调用链的源头生成TraceID,每个微服务在处理请求的时候将相关信息打印到日志文件2.通过ELK进行日志收集，可以在elk里进行traceid的检索。这样每次检索就把一次调用处理的所有日志都显示出来，提高问题定位的效率。对于老师讲的内容主要有两个问题，1.日志主动上报，会不会对微服务的资源有比较大的消耗呢？特别是比较频繁的调用处理。2.服务调用的耗时怎么计算的，没太看懂。

作者回复: 主动上报采用udp方式对性能影响可以接受，另外服务调用的耗时也可以靠上报调用耗时来统计



 1
波波安

2018-10-13

相同之处有系统的搭建都需要数据采集，数据处理，数据存储和数据展示这些步骤

不同之处是服务监控系统主要监控局部的业务数据和日志，服务状况等。服务追踪系统是全局链路的一个调用跟踪。一般与业务无关

展开



 1
丢

2018-09-10

回复何磊“日志上报的阶段是不是在rpc的四个过程中都应该上报？比如在ss阶段，由于服务端挂了，没有响应数据。那么这次rpc调用就无法查询了？”
服务端挂了，客户端会收到异常，还是可以在cr阶段上报

作者回复: 对，客户端等到超时或者异常，就会记录下错误上报



 1
asdf100

2018-09-10

1.在每个请求涉及的四个点都要收集数据并上报，这样在原始业务代码里写上报代码是不是耦合性太强了？
2.假如其中一个调用超市未返回数据，导致多次调用都无法收到服务端的返回信息，如何处理？



 1
铂金小猪

2018-09-08

链路不是http呢？

作者回复: 也可以的，就是埋点采集的代码不同



 1
钟杰

2019-10-24

服务追踪主要是发现故障点，服务监控数据用于找出什么原因导致这个故障点发生故障




杨恒连

2019-07-22

容器现在已经很厉害，所有的追踪都在容器化这一层做了处理




godtrue

2019-05-22

好东西呀😄
我们好像没有这个，有调用链的追踪也是进程内的，而且使用起来也不太方便。

正如其他同学回答的，监控系统的关注点在局部，凡人视角。追踪系统的关注点在全局，上帝视角。

关注局部是为了了解更多的个体信息，关注整体一般是为了定位瓶颈看谁最慢。

单机性能压测时通过监控系统能了解单机的最佳性能，以及机器的各种性能指标，可以针对单机的性能瓶颈进行优化。

全链路压测时，如果有分布式的性能追踪系统，那定位性能瓶颈就方便多啦！

展开




gongxt

2019-03-14

老师列举的似乎都是侵入性太强的工具，有没有其它方法呢？




gongxt

2019-03-14

相同点：
1、都有采集端（agent）进行独立上报
2、服务端收到数据都会对数据进行聚合计算，原始值的存储。这里不同的存储服务有不同的实现
不同点：
1、业务不一样，链接追踪主要针对请求链路进行处理，监控主要是针对服务内的业务指标包括不限于指标，日志等
2、实现方式不一样，监控是时间序列数据库（基于lsm），而trace就不是了（应该是基于树）

展开




饭粒

2019-03-11

监控是对某种对象(功能，接口，硬件资源)的特定性能指标的监测，数据采集的过程可以不侵入业务代码。
追踪是对服务整个RPC调用关系链的追踪，采集数据一般要通过在业务代码埋点获取。



