15 | 如何搭建一个可靠的监控系统?
该思维导图由 AI 生成,仅供参考
ELK
- 深入了解
- 翻译
- 解释
- 总结
搭建可靠的监控系统是关键的技术挑战之一。本文介绍了ELK、Graphite、TICK和Prometheus四种监控系统的实现方案。ELK采用Elasticsearch、Logstash、Kibana三个开源软件产品,Graphite由Carbon、Whisper、Graphite-Web组成,TICK由Telegraf、InfluxDB、Chronograf、Kapacitor组成,而Prometheus则包含多个组件实现数据拉取、存储、报警和展示。文章通过对比这四种方案,提供了选型建议。 在数据收集方面,ELK使用Beats代理,Graphite需要配合使用开源收据采集组件,TICK使用Telegraf,而Prometheus通过jobs/exporters组件获取数据。数据传输方面,ELK、Graphite和TICK采用“推数据”方式,而Prometheus采取拉数据的方式,对服务端的侵入最小。在数据处理和展示方面,各系统有不同的特点和功能,如ELK适合多维度的数据查询,Graphite提供强大的聚合函数,TICK的InfluxDB支持类似SQL语言的复杂操作,而Prometheus采用独特的PromQL查询语言。 总结来看,ELK技术栈成熟且应用广泛,Graphite提供强大的聚合函数和API接入,TICK的InfluxDB功能强大,而Prometheus采用拉数据方式对业务影响较小。从实时性和灵活性角度考虑,时间序列数据库的监控处理功能都要比ELK更加丰富,使用更灵活也更现代化。因此,建议搭建新的监控系统时可以考虑采用Graphite、TICK或者Prometheus其中之一,根据具体需求选择合适的方案。
《从 0 开始学微服务》,新⼈⾸单¥59
全部留言(16)
- 最新
- 精选
- xuanyuanelk更多是日志吧。大家买课程很多希望看到外面看不到的经验,而不是网上文章的拼凑,毫无营养,说实话。
作者回复: elk用作监控的有很多地方,另外专栏面向的读者层次不同,有的读者没有基础知识,照顾下他们,科普还是有必要的,更深的使用经验在考虑单独篇幅里写。
2018-10-01279 - 金hb.Ryan 冷空氣駕到很欣慰,我司的监控技术栈是influxdb+grafana,配合程序/collectd 来推送,不过即使influxdb很强大还是建议适当merge一下,不然...都是泪
作者回复: 哈哈,开源组件在生产环境中用肯定是要优化的
2018-09-283 - 天若有情天亦老elk+xpack 可以做到小规模的业务监控。 就是watcher比较难用 目前用的方案是 elk stack+zabbix ,求更优方案
作者回复: 能cover住需求就行
2018-09-25 - herome墙裂推荐 美团的CAT !!!!2018-09-2818
- 公号-技术夜未眠关于不同类型监控的技术选型建议: 日志监控推荐用ELK Metrics参数监控推荐用promethus+gafana 调用链监控推荐用skywalking 业务监控推荐用业务开发+gafana2020-07-0819
- 钱开开眼界,用时自行研究,这里就是常规介绍2019-06-1516
- 玉剑冰锋个人认为ELK更适合进行故障排查定位、数据分析、深度挖掘方向,不知道老师是否认可?另外请教老师一个问题,Prometheus这种拉取方式在小规模可以体现出优势,大规模的情况拉取是不是就不如推送更优了?2018-09-2724
- 俯瞰风景.监控系统的组成主要涉及四个环节:数据收集、数据传输、数据处理和数据展示。 每个环节都有相应的开源组件可以使用。 成熟的方案有: **1、Beats + Logstash + Elasticsearch + Kibana(Grafana)** **2、StatsD + Carbon + Whisper + Graphite-Web(Grafana)** **3、Telegraf + InfluxDB + Chronograf****(Grafana)**** + Kapacitor ** **4、Prometheus + Grafana** 对于时序数据的处理,后三种方案性能更高,因为有专门的时序数据库来存储数据;对于多维度数据的处理,第一种方案更加合适。2021-10-073
- cqc从官方文档来看,Prometheus的指标存储,很高效,但是问题在于没有成熟的高可用,历史数据归档,海量历史数据查询支持。在调研监控系统的过程中,还发现了小米的open falcon,感觉设计得很复杂,它和Prometheus都属于现代的面向微服务设计的指标监控系统,老师能否有机会深度比较一下?另外,想让老师指正一下我对于监控系统的理解:根据我目前的理解,监控系统可以划分为不同的维度:指标监控(如Prometheus,Zabbix),日志监控(NLK/NFK),调用链监控(zipkin),不知道对不对?2018-11-1513
- 旭东(Frank)国产的有好的监控组件吗?如CAT2018-09-271