当前播放: 超大规模服务的故障“弹性自愈”
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
合辑:大规模基础设施DevOps探索
浅谈Kafka Streams在实时跟踪和监控系统中的应用
超大规模服务的故障“弹性自愈”
下一代大数据实时监控系统
Uber 如何结合DevOps 理念来加速网络基础设施建设的自动化进程

超大规模服务的故障“弹性自愈”

罗蛟 百度共享技术平台部经理

罗蛟,百度共享技术平台部经理

内容介绍

超大规模在线分布式系统,每时每刻都响应着无数的用户真实请求,在服务大规模异常的时刻,尽可能的响应用户请求,而不是拒绝,尽可能快的自动化止损甚至自愈,尽可能准的根因定位甚至自动化智能化,这些都给我们的工作提出了越来越高的要求和挑战。

为此,我们在系统架构、流式数据处理、动态决策等多个层面进行了系统化的设计。借助这一套系统,我们实现了分钟级到十秒级最终到秒级的感知和决策止损系统,大幅度的的减少了故障时刻的损失量级和故障持续时间。本次分享,也主要集中在以上几个方面我们的一些实战经验。

展开
¥4.99 购买
开通VIP
2
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
其他推荐
01:40:05
Apache Kafka,从0.7到1.0:那些年我们踩过的坑
王国璋 Confluent Kafka Streams系统架构师和技术负责人
试看
43:37
工业大数据在智能制造中的应用
孙继珑 积梦智能大数据负责人
试看
46:01
从心开始——谈谈技术管理
唐义哲 英语流利说资深技术经理
试看