月活4.31亿的微博,如何应对流量激增?
极客时间编辑部
讲述:杜力大小:1.12M时长:02:27
近日,InfoQ 采访到了新浪微博高级产品运维架构师刘然,他介绍了新浪微博遇到过哪些高并发场景的典型问题,他们搭建自动化运维平台的过程中踩过哪些坑,又是如何解决的等问题。
事实上,微博的运维团队默默地做了很多大事情,而且他们已经提前踩了很多坑。作为热点事件及社会舆论的核心阵地,今年 6 月,微博月活跃用户数(MAUs)达到了 4.31 亿,日活跃用户数(DAUs)达到 1.90 亿。就微博平台而言,整体 HTTP 接口调用量达到百万 qps,视频流达到 TBps 级吞吐。
据介绍,对于遇到的高并发问题,整体服务中的各个环节哪怕是一行命令的性能不够优,都可能在高并发情况下成为一个问题,引发一次故障。所以他们会联合各个兄弟部门,从应用层到网络层逐层进行容量评估,对于各种遇到过的、可以想象到的短板建设应急预案。
在这之中,尤其是核心路径,经常会准备三套以上的应急预案,主要思路包括扩容、流量转移、降级、封杀等,监控指标实时采集,产出 Dashboard、报警、智能决策。
刘然表示,当前业界的开源组件很多,而盲目地引入开源组件并不一定会提高运维效率,有时候往往会适得其反。开源组件的优势在于开发及维护成本相对较低,功能和性能相对比较稳定成熟。但问题在于开源组件是面对大多数场景的通用的方案,所以在一些定制性问题上很难得到解决方案。而且各组件之间的组合很多时候是十分僵硬的。
在后续二次开发的时候,开源组件需要的学习成本是巨大的。另外开源组件的版本更新问题也很让人头疼。在提供方不再发版后,进行组件升级和替换的过程中是极其痛苦的。所以在满足业务稳定性需求的同时,提升运维自动化的自研占比是非常重要的,它决定了后续自动化所能达到的高度。
刘然表示,他们在人工智能方向也开始有所尝试。但当前在应用落地方向上,还存在着种种问题。后续,他们还会继续投入一部分力量进行探索,并积极和其他公司、团队进行交流。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- 亮出对待开源的态度应该是融合开发。
收起评论