当前播放: 七牛存储运维实践
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看

七牛存储运维实践

林天智 七牛存储&直播运维 负责人

林天智,七牛存储 & 直播运维 负责人

内容介绍

七牛原本的告警系统是通过 zabbix 来触发,然后有一个人工告警通知的团队来通知各个业务线告警,再由各自的运维团队处理告警。这个在规模小的时候没有问题,但是在机器规模变大的时候会遇到很多问题,告警数量爆增,信息流单项无法确认,缺乏历史记录等。需要针对这个来做改造,但是过程中会遇到大量告警如何迁移,如何保证不影响当前的正常工作等,中间运用到一些开源服务比如:prometheus,pushgateway,node_exporter 等,以及一些自己开发的系统。最终存储运维相关的故障减少 80% 以上,以及不需要人工告警团队再继续通知。

资源利用以及集群复制。当前存储的部署是基于物理机部署,对于资源利用很不充分,也不利于集群的复制(私有云),会从这些角度讲如何从物理集群迁移到容器集群。

内容大纲

  1. 监控数据搜集;
  2. 告警收敛;
  3. 告警后续处理;
  4. 容器化方案。
展开
¥4.99 购买
开通VIP
3
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
其他推荐
47:16
百度云报警通告系统的下一幕
周伟 百度智能云事业部资深研发工程师
试看
41:44
去哪儿网监控报警平台的设计和演化
郑松宽 去哪儿网高级运维开发工程师
试看
41:03
Apache SkyWalking V6.0可定制开源APM
彭勇升 永辉云计算 合伙人
试看