分布式架构原理与实践
崔皓
资深架构师
743 人已学习
立即订阅
分布式架构原理与实践
15
15
1.0x
00:00/00:00
登录|注册

第 9 章 指标与监控(1)

部署的分布式系统上线以后,如何知道其是否运行正常?我们需要得到系统的反馈信息,从而确保其正常运行,同时可以根据反馈不断提升系统的性能。监控系统就是最好的反馈手段,它就像一双眼睛,我们通过这双眼睛来“观察”系统。对于分布式系统来说,由于服务和应用分散部署在不同的网络节点,因此监控应用间的调用以及服务器间的关系都相对复杂。本章内容围绕分布式系统的监控展开,首先介绍为什么需要监控系统以及有哪些监控指标。接着对监控系统的功能、分类和分层展开讲解,介绍监控分布式系统的一般过程,并且将监控系统分为日志类、调用链类和度量类。在监控系统的分层中,从下到上有 5 层,分别是网络层、系统层、应用层、业务层、客户端。最后,根据监控系统的不同层次讲述不同的最佳实践,包括 Zabbix(网络层、系统层)、Prometheus(网络层、系统层、应用层、业务层)的原理与实现。总结一下,本章将介绍以下内容。
为什么需要监控系统
监控系统的指标
创建监控系统的步骤
监控系统的分类
监控系统的分层
Zabbix 实现监控系统
Prometheus 实现监控系统

9.1 为什么需要监控系统

从字面意思理解,监控就是对系统产生的数据进行收集、处理和汇总,并且将这些数据通过某种途径以量化的形式展示出来。一旦系统出现问题,就可以通过报警的方式通知系统维护人员,从而保证系统稳定运行。
开发任何一个分布式系统的目的都是为客户提供高质量和高稳定性的应用。应用不可用、服务器死机、服务调用缓慢都会影响客户体验,所以我们要快速收集、汇总、分析信息,从而定位并解决问题。既然是分布式系统,就会面临以下问题。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入介绍了分布式系统监控的重要性、监控指标和实现方法。首先强调了监控系统对于确保系统正常运行和提升性能的重要性,尤其是在分布式系统中。文章详细介绍了监控系统的指标,包括延迟、流量和错误等重要指标,以及监控系统的实现步骤和分类。还提到了监控系统的分层结构和不同层次的最佳实践,以及介绍了Zabbix和Prometheus的原理与实现。文章还介绍了监控系统的步骤和分类,包括实时监控服务、收集运行数据、分析信息、预警故障、定位故障、保证系统稳定运行等步骤。另外,还介绍了日志类监控的实现方法,以ELK为例,详细介绍了ELK的系统架构和Filebeat的体系结构。此外,还介绍了时序数据库的监控方案,以及时序数据库的特点和存储原理。整体来说,本文全面介绍了分布式系统监控的重要性、指标和实现方法,对于需要了解分布式系统监控的读者具有很高的参考价值。文章内容涵盖了监控系统的重要性、指标、实现方法以及具体工具的原理与实现,为读者提供了全面的技术视角和实践指导。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《分布式架构原理与实践》
立即购买
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部