你好,我是王潇俊,今天我和你分析的主题是:如何利用监控保障发布质量。
在前几次的分享中,我详细介绍了发布在持续交付过程中的重要地位,以及如何去思考和设计一套灰度发布系统。作为发布及监控系列的最后一篇文章,今天我就和你聊聊灰度发布的最后一个过程:监控,以及如何做好发布后的监控。
之所以有今天这次分享,最重要的原因是要告诉你:千万不要认为发布结束,就万事大吉了。特别是生产发布,发布结束时才是最危险的时刻。 因为,故障都是伴随着发布变更而来的。所以,我们需要有一套监控系统,及时发现问题、定位问题,帮助我们减少因故障带来的损失。
同时,随着分布式系统的普及,以及 APM(Application Performance Management,系统性能管理)概念的兴起,针对分布式系统的全链路监控系统也逐步发展起来,为持续交付提供了有力的支持。可以说,一套性能优良的监控系统,可以为持续交付保驾护航。
当然,这个专栏的主要内容是帮你解决持续交付的问题,所以我不会去分享监控系统如何设计这种需要一整个专栏才能解决的问题。
因此,我今天分享的重点是,帮助你去理解监控的常规概念,和你聊一些技术选型方案,并一起讨论一些与持续交付有关的问题。