汤泳,苏宁易购 IT 总部监控研发中心总监
在当今互联网时代,企业大都采用分布式系统设计和服务化,内部关系错综复杂,从系统提供的上层服务对用户的体验感知到整体系统的健康稳定的智能化监控已成为企业发展的标配能力,但是也存在着异常故障定位缓慢,甚至找不到问题根源,虽有众多日志监控工具,但没有全链路,各产品分散集成度不高;定位问题及根因分析耗时长,缺乏决策并自动控制(自愈)机制,基本靠人工,且监控机制混乱,对数据中心的性能、安全、稳定性影响缺乏量化及合理性规划;面对大规模高并发的场景,很难兼顾性能与稳定性、可用性。如何解决上述痛点,实现真正的从“检测”到“分析”再到“控制”的监控体系化建设?
本次演讲将和大家一起分享构建苏宁立体式监控的实践。