随着时代的进步,企业 IT 设施规模日益庞大且复杂度不断提升,而业务对系统稳定性的需求却愈发严格。在此背景下,探索更高效的方式来确保业务稳定变得至关重要。鉴于人工智能技术的快速发展,业界正积极利用这一技术来应对运维保障过程中的效率挑战。
在运维领域运用人工智能,开发人员需全面审视并综合考量多重维度。这包括深入理解业务知识,把握用户的使用偏好(即产品设计洞察),并据此设计贴合业务场景与用户需求的算法。此外,还需精心规划系统架构设计与运维部署策略,以确保系统性能卓越、运行可靠,全面满足各项要求。
当前市场上关于智能运维的资料大多聚焦于特定场景下的算法设计与测试成效。而本课程则旨在超越具体的算法细节,从宏观视角探讨人工智能在运维领域的实际应用路径。首先,我们将借鉴推荐系统这一与智能运维较为相似且发展成熟的领域之落地经验。随后,课程将围绕业务、产品、数据、算法、工程这五大核心维度,深入剖析并详细阐述人工智能在运维领域的落地策略与实践方法。
本文着重于方法论层面的探讨。若您渴望掌握智能运维(AIOps)在具体场景中的实际应用,我推荐您订阅我的另外两个课程:《智能运维实战(AIOps)之根因分析》和《智能运维实战(AIOps)之日志数据挖掘》。这两个课程不仅深入剖析了相关场景的算法设计与落地策略,还提供了丰富的配套代码,供您直接参考与应用。
通过课程,你将会学到:
从业务、产品、数据、算法、工程这五个核心方面,全面剖析智能运维的实施路径;
掌握不同运维业务场景下所需采用的算法策略;
课程目录
入门篇
01 | 什么是智能运维:我对智能运维的理解
02 | 它山之石可以攻玉:推荐系统落地策略分析(上)
03 | 它山之石可以攻玉:推荐系统落地策略分析(下)
实践篇
04 | 综合分析智能运维的实施策略
05 | 业务场景探索:AI 如何助力运维工程师应对挑战?
06 | 产品概览:不同业务场景下的智能运维产品
07 | 算法的基础:如何治理运维数据
08 | 智能运维实践:AI 技术在运维领域的应用探索
09 | 算法探索(一):如何深度挖掘时序指标中的异常数据
10 | 算法探索(二):如何深度挖掘日志数据中的异常信息
11 | 算法探索(三):如何快速有效地定位故障
12 | 算法探索(四):如何快速有效地恢复故障
13 | 智能运维系统:架构与设计





