13 | 趋势分析与回归:父母高,孩子一定高么?
郭炜
该思维导图由 AI 生成,仅供参考
数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
回归(Regression)是由英国生物学家弗朗西斯·高尔顿(FrancisGalton)提出来的。简单来讲,回归就是研究一个变量和另外一个变量的变化关系。其中一个变量我们叫做因变量,另外一个叫做自变量。多元的回归,就是研究一个因变量和多个自变量之间的关系。
一般来说,当我们知道了某一种情况或现象,想要去了解这个结果和前面哪些因素发生了怎样的关系(例如体重和年龄的关系),或者想验证某一些数据其实和结果没关系,这个时候我们就可以用回归验证。当我们知道了过去的一些数据情况,我们想根据以前的经验值,预测将来可能出现的结果,这个时候我们也可以用回归分析和相关的算法。
回归的算法种类与使用
根据回归使用的场景不同,我们可以把它分成线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归等等。这些回归的整体逻辑比较类似,今天我给你重点介绍最常用的三种回归算法。
第一类是线性回归。线性回归里最简单的一种就是一元线性回归,它有两个变量,一个叫做因变量(Y),一个叫做自变量(X)。我们可以用 Y=a+bX 这个公式来拟合一元线性回归方程。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
回归分析是一种研究变量之间关系的方法,通过回归算法可以找到变量之间的趋势和关联。文章介绍了线性回归、逻辑回归和多项式回归三种常用的回归算法。线性回归适用于研究两个变量之间的线性关系,但对异常值敏感;逻辑回归用于分类问题,将离散的因变量转化为连续值进行回归分析;多项式回归适用于拟合多项式关系,但需要注意过拟合和欠拟合的问题。文章强调了数据准备工作的重要性,以及回归分析并不代表因果关系的确立,需要结合业务依据。通过本文,读者可以了解不同回归算法的特点和应用场景,以及在实际应用中需要注意的问题。 此外,文章还介绍了均值回归的概念,强调了现实情况往往趋向于平均值,而不是极端的结果。作者通过身高遗传和体育比赛的例子说明了均值回归的普遍存在,并鼓励读者在工作和生活中用一颗平常心不断提高自己的平均水平。最后,读者被引导思考自己在工作和生活中是否遇到过均值回归的情况,以及从中学到了什么。 总之,本文通过介绍回归分析和均值回归的概念,引导读者了解不同回归算法的特点和应用场景,以及在实际应用中需要注意的问题,同时也提醒读者在面对现实情况时要保持平常心,不断提高自己的平均水平。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》,新⼈⾸单¥59
《数据分析思维课》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(24)
- 最新
- 精选
- 江小飞经济周期,太极转化,祸福轮转,都是一种均值回归。
作者回复: 是的,祸兮福所倚,福兮祸所伏
2021-08-2710 - Len我能说我打王者荣耀经常遇到均值回归,几场连胜后必遇几场连败,反之亦然。。。
作者回复: 哈哈,其实是背后的匹配算法有讲究,不断给你挑战,又不让你觉得失望不玩了,这样才有成就感
2021-08-3028 - 那时刻均值回归可以对应慎始敬终中敬终。 另外,请问老师,如何判断数据需要均值回归而不是线性回归呢?
作者回复: 这个是两个不同的概念,均值回归是说现实中永远不像我们预测的那么好或者那么差。而,线性回归是一个预测的算法,只是在理想状态下才会出现
2021-08-273 - 不再是入门水平python的小宇我刚毕业工作能力很差,换了很多工作,但是一直保持努力精进自己,终于跳槽到一家不错的公司,老板和团队都不错,这就是均值回归吧,保持努力,加上运气等等,不可能一直低谷
作者回复: 加油,珍惜每次机会,人生里机会并不多的
2021-11-252 - 莹子郭老师又来鸡汤了 但是这个回归均值的概念却常常被忽略 公司有个红人,老板很欣赏,各种资源支持都给到他,好像他的一切想法都是好的,成功了自然是好,失败了就是走在创新的道路上....... 而其他人中有个爱说大实话但好听的同事,却常常被老板忽视,甚至某些行为偏与之建议相悖 如果老板能够真正理解均值回归,知道用人之长,一视同仁,形成健康的企业氛围就好了
作者回复: 哈哈哈,是的,所以这个课老板最应该听
2021-09-2421 - 80分均值回归的结果是正态分布。至于为什么会发生均值回归,是因为变量满足这些条件: 1. 相互独立 2. 方差有限 3. 任何一小部分随机变量都不会贡献大部分方差 既然均值回归是必然发生的,那么能否调整回归算法,使其考虑到均值回归的影响?但是均值还有何时回归和回归何处的难点。
作者回复: 是的,预测不能没有数据支持的情况下乱调整呀,预测结果永远不会那么好,心里有数就好啦
2021-09-201 - 进化菌人和人之间的差异没有那么大,不存在着优生学,所以该努力还是得努力,不要找太多借口。但是,确实生长在富裕家庭里能得到更多的资源,而这却是我们无法改变的事实,也不必拿这做借口了。2021-08-2711
- 范均值回归的结论似乎又回到“大数定律和小数陷阱”,对于足够多的样本来说,是均值回归,但是对于独立的个体样本来说,又不一定。2021-09-138
- Jove这次多了思维导图,赞2021-08-275
- geigei天下大势分久必合合久必分,哈哈 这个应该也是均值回归吧2021-10-273
收起评论