作者回复: 感谢你的分享!比较全面,其他同学也可以一起看看。 有关最后的问题,可观测性并不是某种工具提供的某种能力,而是能真正达到在分析系统状态或者问题时候,数据的关联和多维度分析,帮助定位问题原因。如果还是几个工具的整合,需要人工在工具间跳转和并搜寻判断,那这样的效率会打很多折扣。
作者回复: 感谢分享!你说的没错,是需要根据系统和服务的不同类似,来从不同维度建立告警。告警风暴,一般是可以从分组、抑制、静默等角度去降低,而另一方面,在我后面的课程中也会讲到,最重要的告警应该是和用户使用相关,应该关注真正影响到用户体验的指标。
作者回复: 可观测的数据采集确实更多维度,对后端存储性能要求更高,包括不同数据类型的存储
作者回复: 可观测性的目标就是保障系统可靠性,快速找到问题的根本原因
作者回复: 归纳得很到位!
作者回复: 这里我主要是想表明不能仅仅局限在应用链路的插桩之上,也需要关注其他维度的数据采集和联合。
作者回复: “灵活的方式”是指能从各种角度,设定各种标签,从而在之后分析数据的时候能够从各种维度分析。“不需要首先预知”,也是和传统监控的区别,因为现代化系统架构复杂,很多时候发生问题,可能之前都没有遇到过,也没法把所有情况就先预估出来。这个和插桩并不矛盾,插桩是需要的,但也不可能把所有可能出现问题的地方都事先进行插桩,重要的还是能够在出现问题的时候,进行各维度的分析以及快速定位。
作者回复: 关联分析和 All-in-One 产品可以看下后续的实战课程,会有示例的介绍。业务的监控需要和业务一起来进行分析,是需要有一些自定义的插桩
作者回复: 可观测性数据的体量确实比以往要大很多。但数据的采集还是建议更加全面,这样在分析问题的时候才更有效率。所以从另一方面来说,数据存储也是在不断更新换代,可以考虑更高性能的方案,比如VictoriaMetrics等。
作者回复: 前面会多说一些概念,后面就会有实战的课程