如何理解AIOps?
极客时间编辑部
讲述:丁婵大小:1.51M时长:03:19
运维技术的发展已经进入深水期,随着 Docker、OpenStack、Puppet 等技术的流行,以及 CI/CD、DevOps 等理念的落地生根,自动化运维的发展迎来了小高潮。整体来看,自动化运维平台帮助提升了运维的效率,并减少了因为人工和流程操作而引起的运维故障。
但近几年,随着云计算、微服务等技术的流行,以及互联网业务的迅速发展,运维人员需要关注的服务数量也呈现了指数级增长,自动化运维也遇到了新的难题,比如面对繁多的报警信息,运维人员应该如何处理?故障发生时,又如何才能迅速定位问题呢?
恰好此时人工智能崛起,那上面的这些问题是否能通过“AI+Ops”的这种跨界创新的方式来解决呢?
Gartner 在 2016 年提出了 AIOps 的概念,并预测到 2020 年,AIOps 的采用率将会达到 50%。简单来说,AIOps 就是希望基于已有的运维数据,比如日志、监控信息、应用信息等,用机器学习的方式来进一步解决自动化运维没办法解决的问题。
就目前来看,国内的百度、搜狗、宜信、阿里巴巴都已经探索尝试了 AIOps,并且取得了不错的效果。那到底该如何理解 AIOps 呢?就这个问题,InfoQ 记者采访了美丽联合集团运维经理赵成。
在赵成看来,理解 AIOps 之前,应该先了解 AI、机器学习、深度学习这几个概念。
简单来说,人工智能是一个广义概念,最早期提出来的时候,是希望 AI 能够完全具备人类的智慧,这属于“强人工智能(General AI)”。但是除了科幻电影和小说,在现实中还没有可能达到这个程度。因为这样的“强人工智能”不仅对计算机技术要求极高,对生物医学技术也有很高的要求,毕竟“强人工智能”的前提是弄懂人类大脑运转的每一个细节。
但研究过程中,研究人员发现虽然没法让机器完全具备人类一样的智慧,但是在非常具体和特定的领域,机器可以做得比人类更好,比如图形图像处理、语音识别等。这些人工智能的应用,被称为“弱人工智能(Narrow AI)”,而这些应用的实现手段,就得益于机器学习算法的长足进步,其中深度学习又是机器学习领域更为精深的一部分。
目前提到的 AI,更多的是依赖机器学习(包含深度学习)算法实现的 AI 场景。在了解概念之后,再回到 AIOps 上来,把 AIOps 拆分为 AI + Ops 会更准确一些,也就是 Ops 与 AI 相结合可以做的事情。但关于 AI,Gartner 的定义是 Algorithmic IT,而不是 Artificial Intelligence,赵成起初也觉得不是很合理,但是在认真理清整个关系之后,他觉得 Gartner 的定义也没有问题。
同时,赵成认为不必纠结于 AIOps 的定义,因为不管这里的 AI 到底是 Algorithmic IT 还是 Artificial Intelligence,最终使用的手段还是机器学习。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论