AIOps 实战课

张云河

资深系统架构师

29 人已学习

新⼈⾸单¥39

课程目录

已更新 7 讲/共 17 讲

课程介绍 (1讲)



课程介绍｜传统运维的挑战及AIOps核心价值与场景

时长 28:26

实验一：基于机器学习的指标异常检测 (6讲)



04｜代码实战（二）：模型训练、预测与评估

时长 16:35

时长 23:07

时长 22:13

时长 24:51

时长 22:11

06｜代码实战（四）：定义主函数，并验收实验结果

时长 15:16



AIOps 实战课



留言





沉浸
阅读





手机端



回顶部

当前播放: 04｜代码实战（二）：模型训练、预测与评估

00:00 / 00:00

字幕已开启

高清

高清

1.0x

3.0x
2.5x
2.0x
1.5x
1.25x
1.0x
0.75x
0.5x

网页全屏

全屏

00:00

付费课程，可试看

课程介绍｜传统运维的挑战及AIOps核心价值与场景

04｜代码实战（二）：模型训练、预测与评估

02｜指标异常检测中用到的数据

03｜代码实战（一）：数据加载与预处理

01｜实验一概览：理论基础与实验环境准备

05｜代码实战（三）：结果可视化

06｜代码实战（四）：定义主函数，并验收实验结果



本节摘要

以下文稿由 AI 整理，仅供参考。

基于孤立森林的异常检测：模型训练与评估详解

在机器学习异常检测任务中，孤立森林（Isolation Forest，也称隔离森林）是一种高效且常用的算法。本文将逐步介绍如何定义孤立森林模型的训练函数、设置关键参数、完成模型训练，并进行预测与评估。

定义模型训练函数

首先，我们定义一个用于训练孤立森林模型的函数。该函数需要接收两个主要参数：经过预处理后的训练集数据，以及数据中异常样本的比例（contamination）。在实际生产环境中，异常比例通常接近 3% 左右，因此我们可以将默认值设为 0.03。

复制代码

 def train_isolation_forest(train_data, contamination=0.03):
    # 模型训练逻辑
    pass

模型参数配置

在生成孤立森林模型对象时，需要配置一系列超参数，这些参数直接影响模型的精度和训练效率：

树的数量（n_estimators）：默认值为 100，但我们可以设置为 200。树的数量越多，模型越准确，但训练时间也会相应增加。需要在效率与精度之间做好平衡。
每棵树的采样数量（max_samples）：理论最优值为 256，这里也设置为 256。
每棵树使用的特征比例（max_features）：设置为 0.7，即使用 70% 的特征，有助于减少过拟合。
异常比例（contamination）：使用传入的默认值 0.03。
随机种子（random_state）：设置为固定值（如 100 万），以保证结果的可重现性。
CPU 核心数（n_jobs）：设置为 -1，表示使用所有可用的 CPU 核心进行并行计算。

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论

	def train_isolation_forest(train_data, contamination=0.03):
	# 模型训练逻辑
	pass