成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

07|AI模型的构建过程是怎样的?(下)

你好,我是海丰。
上节课,我们讲了一个模型构建的前 2 个环节,模型设计和特征工程。今天,我们继续来讲模型构建的其他 3 个环节,说说模型训练、模型验证和模型融合中,算法工程师的具体工作内容,以及 AI 产品经理需要掌握的重点。

模型训练

模型训练是通过不断训练、验证和调优,让模型达到最优的一个过程。那怎么理解这个模型最优呢?下面,我拿用户流失预测模型这个例子来给你讲讲。
这里,我想先给你讲一个概念,它叫做决策边界,你可以把它简单理解为我们每天生活当中的各种决策。比如,当华为 Mate 降价到 5000 元的时候我就打算购买,那这种情况下我的决策边界就是 5000 元,因为大于 5000 元的时候我不会购买,只有小于 5000 元时我会选择购买。
那放到预测用户流失这个案例中,我们模型训练的目标就是,在已知的用户中用分类算法找到一个决策边界,然后再用决策边界把未知新用户快速划分成流失用户或者是非流失用户。
不同算法的决策边界也不一样,比如线性回归和逻辑回归这样的线性算法,它们的决策边界也是线性的,长得像线条或者平面,而对于决策树和随机森林这样的非线性算法,它们的决策边界也是非线性是一条曲线。因此,决策边界是判断一个算法是线性还是非线性最重要的标准
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文从模型融合和模型部署两个方面展开讲解,首先介绍了模型融合的概念和方法,包括简单的加权平均和投票法,以及复杂的 Bagging 和 Boosting。强调了模型融合可以提升模型的准确率,但需要均衡开发成本来综合考虑。接着详细讨论了模型部署的重要性,指出模型部署是 AI 产品上线中必不可少的一环,介绍了模型部署的方式和交互方式。文章通过具体案例和实用指南,为读者提供了深入了解模型构建过程的重要知识点,既有理论深度又有实践指导,对于技术人员和产品经理都具有重要参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(18)

  • 最新
  • 精选
  • Yesss!
    数据准备最重要,这决定了整个模型的上限

    作者回复: 赞同 👍

    2021-01-13
    3
  • Rosa rugosa
    数据和特征工程决定了机器学习的上限,模型和算法只是逼近这个上限。
    2021-03-11
    16
  • 刘科-悟方
    深度学习数据准备最重要,数据样本越多模型会自寻到特征工程;机器学习特征工程最重要,依靠人工归纳的特征来提高模型预测准确度。
    2020-12-28
    1
    10
  • Pale Blue
    最重要的是特征工程。 因为特征工程考验了产品经理对自己业务以及业务目标的理解程度,比方说根据自身对业务的理解创建出超级特征值,可以对模型的性能有极大的提升,减少很多工作内容。
    2021-09-06
    4
  • 产品部1
    对于产品经理来说,特征工程(尤其是特征)选择是整个模型构建的最重要阶段,其他的事情可以交给算法同学。
    2022-03-20
    3
  • 伟鸿
    模型验证部分的配图没太看懂,「训练精度」和「泛化精度」两条曲线是否可以这样理解:训练精度——模型越复杂,对「样本数据」的预测越准(模型性能不断递增);「泛化精度」——但是在对「未知数据」的预测上,训练精度过高的模型,预测准确性反而会回落,称之为「过拟合」或者「泛化能力弱」。
    2020-12-28
    3
  • escray
    模型训练一般是算法工程师为主,如何找到拟合能力和泛化能力的平衡点,这个有点“玄学”。对于交叉验证,文中并没有给出进一步的解释,我猜大概就是不断的调整参数,然后看验证结果吧。 召回率、F1、KS、AUC 方差、MSE PSI Blending、Staking、Bagging、Boosting、AdaBoost、GBDT、XGBoost、LightGBM 又多了一些不明觉厉的“黑话”,希望课程后面有解释,作为产品经理,能够明白这些“行话”是什么意思,能够判断数字大小代表模型的优劣,估计也就足够了。
    2022-04-13
    2
  • 俯瞰风景.
    建立特征最重要。 就算是样本量小,如果能够提取具有洞察的特征标签,也能得到不错的模型。
    2021-08-25
    1
  • Geek_52525e
    特征构建最重要,也是我最喜欢的部分。
    2021-04-17
    1
  • BAYBREEZE
    标准答案:最重要的是样本选择与特征工程。这个决定了机器学习的上限。
    2021-01-21
    1
收起评论
显示
设置
留言
18
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部