AI 数据挖掘实战
解锁数据价值,精通核心算法,搞定实际业务难题
陈旸  清华大学计算机博士
视频课
已完结·共 20 讲
|
1 人已学
|
收藏
立即购买
59

你将获得

"1. 熟练掌握分类决策、关联关系挖掘等数据挖掘核心方法,筑牢数据挖掘基础。​

2. 精通逻辑回归、XGBoost 等多种算法的应用,轻松解决实际业务问题。​
3. 显著提升在采购、销售等业务场景中的数据挖掘实战能力,赋能业务决策。​
4. 学会运用时间序列和运筹规划方法,有效应对复杂业务难题。"

课程介绍

本课程围绕 AI 数据挖掘展开,全面涵盖分类决策、关联关系挖掘、集成学习、时间序列决策及运筹规划等核心内容。在分类决策章节,深入讲解数据分类决策意义、BCG 矩阵划分,通过采购物料分类与决策、保险客户续保预测等案例,教授逻辑回归、决策树与随机森林等模型的构建及可解释性分析,还有评分卡模型的构建与应用。关联关系挖掘章节解析关联规则、支持度等概念,借助超市案例、BreadBasket 购物清单分析等,让学员掌握关联规则与相关性分析方法,并学会从销售数据中找到影响销售的关键因素。集成学习部分介绍集成学习概念、GBDT 原理及 XGBoost 等工具,通过男女声音识别、二手车价格预测等实战案例,提升学员在项目中运用机器学习神器的能力。时间序列决策章节讲解时间序列预测模型及 Facebook prophet 工具,结合沪市指数预测、资金流入流出预测等案例,培养学员时序预测能力。运筹规划章节介绍常见规划问题及相关工具,通过 Santa 接待安排、旅行商问题等案例,助力学员解决复杂场景下的规划难题。课程通过理论与实战结合,帮助学员全面掌握数据挖掘技能,有效应对各类实际业务挑战。​

课程目录

" 第一章:分类决策

  1. 数据分类决策意义
  2. BCG 矩阵划分
  3. 案例: 采购物料分类与决策
  4. 构建分类器并对数据进行洞察
  • 逻辑回归
  • 决策树与随机森林
  • 模型可解释性
  1. 评分卡模型
  • 评分卡模型的构建
  • WOE 与 IV 值计算
  • 字段分箱
  • 针对不同的分类制定不同的采购策略
  1. 案例:保险客户续保预测
  • 数据可视化探索
  • 构建续保预测模型
  • 特征洞察:哪些用户更容易续保
  • 构建续保分 (评分卡模型)

第二章:挖掘数据中的关联关系
 1. 挖掘数据中的关联关系

  • 超市如何预知高中生怀孕
  • 什么是关联规则
  • 支持度、置信度和提升度
  • Apriori 算法
  • BreadBasket:面包店购物清单的关联分析
  • MovieLens:电影分类中的关联分析
  • MovieActors:电影演员中的关联分析
  • 关联规则与协同过滤的区别
  • 关联规则中的最小支持度、最小置信度该如何确定
  1. 相关性分析
  • 数据相关性分析
  • 回归分析模型与使用
  • 一元回归、多元回归、多项式回归
  • 案例:股票相关性分析
    案例:从销售数据中找到影响销售的主要原因

第三章:机器学习神器与应用

  1. 什么是集成学习
  2. GBDT 原理
  3. XGBoost、LightGBM、CatBoost
  4. 传统行业中使用最多的预测神器
  5. 如何在项目中使用机器学习神器
  6. 机器学习实战
  • 案例:男女声音识别。
  • 案例:员工离职预测。
  • 案例:二手车价格预测 (特征工程、XGBoost 训练与调参、从模型中洞察特征重要性模型融合的原理与技巧)

第四章:时间序列决策

  1. 时间序列分析
  • 什么是时间序列预测
  • AR、MA、ARMA、ARIMA 模型
  • 使用 ARMA/ARIMA 对沪 - 市指数进行预测
  • 案例:对沪市指数走势进行预测
  • 案例:资金流入流出预测
  1. 时间序列挖掘
  • Facebook 时序分析工具 prophet
  • 案例:页面流量预测
  • 案例:交通流量预测
  • 基于 Transformer 的时序预测
  • Informer 与 FEDformer
  • Al 大赛:资金流入流出预测

第五章:运筹规划

  1. 常见规划问题: 线性规划、整数规划、混合整数规划
  2. pulp 工具
  3. Google ortools
  4. 案例:Santa 的接待安排
  5. 复杂场景下的规划问题
  6. 案例:使用 Ortools 求解旅行商问题
  7. 案例:指定城市的旅行商 TSP
  8. 案例:多辆车的路径规划 VRP
  9. 案例:带有容量约束的 VRF
  10. 案例:带有时间窗口约束的 VRP
  11. 案例:带有指定拿起放下约束的 VRP"
查看更多

订阅须知

  1. 订阅成功后,推荐通过“极客时间”App 端、Web 端学习。
  2. 本课程为虚拟商品,交付形式为视频,一经订阅,概不退款。
  3. 订阅后分享海报,每邀一位好友订阅有现金返现。
  4. 戳此先充值再购课更划算,还有最新课表、超值赠品福利。
  5. 企业采购推荐使用“极客时间企业版”便捷安排员工学习计划,掌握团队学习仪表盘。
  6. 戳此申请学生认证,订阅课程享受原价 5 折优惠。
  7. 价格说明:划线价、订阅价为商品或服务的参考价,并非原价,该价格仅供参考。未划线价格为商品或服务的实时标价,具体成交价格根据商品或服务参加优惠活动,或使用优惠券、礼券、赠币等不同情形发生变化,最终实际成交价格以订单结算页价格为准。
讲师

陈旸

清华大学计算机博士

陈旸,清华大学计算机博士,“数据分析实战 45 讲”作者。前 IBM 中国研究院工程师。IEEE & ACM Member,中国人工智能协会成员,中国计算机协会 CCF 大数据专委。
看过的人还看了
1.5 小时快速入门 GPT 技术理论
彭靖田
LangChain 开发者,谷歌开发者专家

1讲 | 403 人已学习

¥29¥59
高并发系统设计 40 问
唐扬
美图公司技术专家

49讲 | 50930 人已学习

¥59¥129
NLP 实战高手课
王然
众微科技 AI Lab 技术负责人、阿姆斯特丹大学数学和计量经济学双硕士

160讲 | 16789 人已学习

¥68¥199
程序员的个人财富课
王喆
璞元科技高级顾问,Roku 推荐系统架构负责人

36讲 | 20699 人已学习

¥68¥199
Tony Bai · Go 语言第一课
Tony Bai
资深架构师,tonybai.com 博主

66讲 | 23840 人已学习

¥59¥129
Web 漏洞挖掘实战
王昊天
螣龙安科 CEO 兼创始人

44讲 | 15661 人已学习

¥59¥129