零基础实战机器学习
黄佳
新加坡埃森哲公司资深顾问,《零基础学机器学习》作者
新⼈⾸单¥59.9
585 人已学习
课程目录
已更新 5 讲 / 共 23 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词|开发者为什么要从实战出发学机器学习?
免费
准备篇 (4讲)
01|打好基础:到底什么是机器学习?
02|工具准备:安装并使用Jupyter Notebook
03|实战5步(上):怎么定义问题和预处理数据?
04| 实战5步(下):怎么建立估计10万+软文点击率的模型?
零基础实战机器学习
15
15
1.0x
00:00/00:00
登录|注册

04| 实战5步(下):怎么建立估计10万+软文点击率的模型?

你好,我是黄佳。欢迎来到零基础实战机器学习。
上一讲,我们通过一个项目讲解了“实战 5 步”的前两步。在第一步“定义问题”中,我们定义了要处理的问题,也就是根据点赞数和转发数等指标,估计一篇文章能实现多大的浏览量。同时我们还将它归类为回归问题;在第二步“收集数据和预处理”中,我们做好了数据的预处理工作,还把数据集拆分成了这四个数据集:
特征训练集(X_train)
特征测试集(X_test)
标签训练集(y_train)
标签测试集(y_test)
有了这些数据集后,我们就可以开始考虑选什么算法,然后建立模型了。所以,今天这节课我们继续完成“实战 5 步”中的后三步:选择算法并建立模型、训练拟合模型和评估并优化模型性能,来把这个项目做完。下面,我们先看看怎么选择算法并建立模型。

第 3 步 选择算法并建立模型

在这一步中,我们需要先根据特征和标签之间的关系,选出一个合适的算法,并找到与之对应的合适的算法包,然后通过调用这个算法包来建立模型。
选算法的过程很考验数据科学家们的经验,不过,你也无需担心自己没有经验,在这个课程中,我会给你讲清楚每一个实战中所用的算法的原理,帮助你建立起选算法的直觉。
具体到我们这个项目里,在上一讲中我说过,我们这个数据集里的某些特征和标签之间,存在着近似线性的关系。而且,这个数据集的标签是连续变量,因此,适合用回归分析来寻找从特征到标签的预测函数。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
该试读文章来自付费专栏《零基础实战机器学习》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥59.9
立即订阅
登录 后留言

精选留言(1)

  • 年轻
    👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍👍

    作者回复: 给力!后续内容更精彩,敬请期待。

    2021-09-06
收起评论
1
返回
顶部