当前播放: 阿里智能化故障治理流程探索和实践
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
合辑:智能高效运维
阿里智能化故障治理流程探索和实践
基于形变分析模型的美团外卖业务异常检测系统建设与实践
百度服务可用性工程建设

阿里智能化故障治理流程探索和实践

司宇 阿里巴巴GOC-监控中心技术专家

司宇,阿里巴巴 GOC- 监控中心技术专家

内容介绍

阿里巴巴集团拥有电商、金融、文娱、新零售、云计算等种多种业务形态,如何对这些业务形态做集团层面的统一故障治理,对产品 / 技术 / 运营都是巨大的挑战。阿里巴巴集团全球运行指挥中心(GOC)通过多年的探索,积累了大量跨 BU 故障治理经验,并在过程中使用了创新了自动化、智能化体系。

本次演讲将会对阿里巴巴集团故障治理整体流程及实战中的自动化、智能化体系做以介绍,并对未来故障治理领域智能运维工作进行展望。

内容大纲

1、阿里巴巴全局故障治理流程

2、基于 AIOps 的全局故障治理架构

3、新零售 / 云计算等新业态给全局故障治理带来的挑战
故障分维度下钻分析
全局统一的监控 / 报警接入网关

4、实战案例讲解
故障知识图谱
故障等级定义结构化
自动化通告
智能应急助手
业务背景及问题拆解
通告内容自动纠错
故障场景自动分析升级

5、智能运维落地方案实施建议

展开
¥4.99 购买
开通VIP
13
登录 后留言

精选留言(1)

  • docker
    刚毕业第一份工作就是监控,7*24,用的工具就是zabbiz,当时在想那些大公司用什么来做监控呢,他们是不是需要7*24,现在看来也是这样的,不过监控纬度,量级,智能化比我们 好太多
    2019-05-16
收起评论
其他推荐
39:21
从平台构建到领域深耕: Kubernetes在华为云的实践与发展
王泽锋 华为云 Kubernetes开源负责人
试看
45:15
基于Istio on Kubernetes云原生应用的最佳实践
王夕宁 阿里云 高级技术专家
试看
32:48
微博深度学习平台基于Kubernetes的分布式解决方案
于翔 新浪微博 机器学习研发架构师
试看