零基础实战机器学习
黄佳
新加坡埃森哲公司资深顾问,《零基础学机器学习》作者
新⼈⾸单¥59
776 人已学习
课程目录
已更新 9 讲 / 共 23 讲
0/4登录后,你可以任选4讲全文学习。
开篇词 (1讲)
开篇词|开发者为什么要从实战出发学机器学习?
免费
准备篇 (4讲)
01|打好基础:到底什么是机器学习?
02|工具准备:安装并使用Jupyter Notebook
03|实战5步(上):怎么定义问题和预处理数据?
04| 实战5步(下):怎么建立估计10万+软文点击率的模型?
业务场景闯关篇 (4讲)
05 | 数据探索:怎样从数据中找到用户的RFM值?
06 | 聚类分析:如何用RFM给电商用户做价值分组画像?
07|回归分析:怎样用模型预测用户的生命周期价值?
08 | 模型优化(上):怎么用特征工程提高模型效率?
零基础实战机器学习
15
15
1.0x
00:00/00:00
登录|注册

08 | 模型优化(上):怎么用特征工程提高模型效率?

你好,我是黄佳。欢迎来到零基础实战机器学习。
经历过了前面几个项目实战,你是不是想告诉我说,佳哥,机器学习的流程也很简单,似乎只要选个模型并重复 5 个步骤,就可以搞定任何数据集。
看起来是这样,不过也没有这么简单。模型,谁都可以构建,但是,如何让模型的性能更优,才是我们真正的考验。今天,我们就来谈一个与模型优化相关的重要内容,也就是特征工程。
人们常说,数据和特征决定了机器学习的上限,而模型和算法只是无限逼近这个上限而已。请你想一想,在那些给定数据集的机器学习竞赛中,高手们为什么能在数据集相同、模型也类似的前提下,让模型达到一个很高的预测准确率?其实,就是因为他们大都通过漂亮的特征工程,提高了机器学习的上限。
特征工程说起来很简单,就是指优化数据集的特征,使机器学习算法更起作用的过程,但用好特征工程并不容易。对于很多初学者来说,常常感觉特征工程实现起来种类繁多,五花八门,不知道怎么下手。今天这节课我就来带你解决这一难题。
根据我这么多年的经验和理解,特征工程其实是有章可循的。总结起来,几乎所有的特征工程,都逃不开三个基本的思路:特征选择,特征变换和特征构建。只要你掌握了它们,以后每拿到一个新的问题和新的数据集时,都可以从这三个维度去分析。这样,你就不至于无从下手,你的特征工程也不会有大的偏差。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/1000字
划线
笔记
复制
该试读文章来自付费专栏《零基础实战机器学习》,如需阅读全部文章,
请订阅文章所属专栏新⼈⾸单¥59
立即订阅
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
返回
顶部