监督学习模型和算法的“三步套路”
极客时间编辑部
讲述:丁婵大小:2.45M时长:02:41
想要成为合格或者优秀的人工智能工程师或数据科学家,机器学习基础知识必不可少。然而,机器学习领域浩如烟海,各类教材和入门课程层出不穷。特别是机器学习基础需要不少数学知识,这对于想要进入这一领域的工程师而言,无疑是一个较高的门槛。
抛开机器学习流派和算法模型不谈,机器学习主要解决两类问题:监督学习和无监督学习。据了解,监督学习的基础是三类模型,包括线性模型、决策树模型、神经网络模型。
掌握这三类模型就掌握了监督学习的主干。利用监督学习来解决的问题,占所有机器学习或者人工智能任务的绝大多数。这里面,有 90% 甚至更多的监督学习问题,都可以用这三类模型得到比较好的解决。
同时,这三类监督学习模型又可以细分为处理两类问题:分类问题和回归问题。分类问题的核心是如何利用模型来判别一个数据点的类别。这个类别一般是离散的,比如两类或者多类。回归问题的核心则是利用模型来输出一个预测的数值。这个数值一般是一个实数,是连续的。
在学习这两大类模型和算法的时候,有一个技巧,也就是“三步套路”,反复用这三个方面来审视当前的模型。
首先第一步,需要回答的问题是,线性回归对现实场景是如何抽象的。顾名思义,线性回归认为现实场景中的响应变量(比如房价、比如票房)和数据特征之间存在线性关系。
有了这样的假设以后。第二步就要看线性回归模型的参数是如何求解的。这里从历史上就衍生出了很多方法。线性回归的解析解虽然简单优美,但是在现实计算中一般不直接采用,因为需要对矩阵进行逆运算,而矩阵求逆运算量很大。解析解主要用于各种理论分析中。
最后第三步,就要看如何评估线性回归模型。由于线性回归是对问题的响应变量进行一个实数预测。那么,最简单的评估方式就是看这个预测值和真实值之间的绝对误差。如果对于每一个数据点我们都可以计算这么一个误差,那么对于所有的数据点而言,就可以计算一个平均误差。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论