数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

13 | 趋势分析与回归:父母高,孩子一定高么?

课后思考
回归分析
数据分析思维课

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
散点图那节课里,我们其实留下了一个问题:我们想找一个趋势线把这个散点图的趋势画出来,那么趋势线我们怎么才可以找到呢?最常见的做法就是用我们今天要讲的回归算法。
回归(Regression)是由英国生物学家弗朗西斯·高尔顿(FrancisGalton)提出来的。简单来讲,回归就是研究一个变量和另外一个变量的变化关系。其中一个变量我们叫做因变量,另外一个叫做自变量。多元的回归,就是研究一个因变量和多个自变量之间的关系。
一般来说,当我们知道了某一种情况或现象,想要去了解这个结果和前面哪些因素发生了怎样的关系(例如体重和年龄的关系),或者想验证某一些数据其实和结果没关系,这个时候我们就可以用回归验证。当我们知道了过去的一些数据情况,我们想根据以前的经验值,预测将来可能出现的结果,这个时候我们也可以用回归分析和相关的算法。

回归的算法种类与使用

根据回归使用的场景不同,我们可以把它分成线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归等等。这些回归的整体逻辑比较类似,今天我给你重点介绍最常用的三种回归算法。
第一类是线性回归。线性回归里最简单的一种就是一元线性回归,它有两个变量,一个叫做因变量(Y),一个叫做自变量(X)。我们可以用 Y=a+bX 这个公式来拟合一元线性回归方程。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

回归分析是一种研究变量之间关系的方法,通过回归算法可以找到变量之间的趋势和关联。文章介绍了线性回归、逻辑回归和多项式回归三种常用的回归算法。线性回归适用于研究两个变量之间的线性关系,但对异常值敏感;逻辑回归用于分类问题,将离散的因变量转化为连续值进行回归分析;多项式回归适用于拟合多项式关系,但需要注意过拟合和欠拟合的问题。文章强调了数据准备工作的重要性,以及回归分析并不代表因果关系的确立,需要结合业务依据。通过本文,读者可以了解不同回归算法的特点和应用场景,以及在实际应用中需要注意的问题。 此外,文章还介绍了均值回归的概念,强调了现实情况往往趋向于平均值,而不是极端的结果。作者通过身高遗传和体育比赛的例子说明了均值回归的普遍存在,并鼓励读者在工作和生活中用一颗平常心不断提高自己的平均水平。最后,读者被引导思考自己在工作和生活中是否遇到过均值回归的情况,以及从中学到了什么。 总之,本文通过介绍回归分析和均值回归的概念,引导读者了解不同回归算法的特点和应用场景,以及在实际应用中需要注意的问题,同时也提醒读者在面对现实情况时要保持平常心,不断提高自己的平均水平。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(24)

  • 最新
  • 精选
  • 江小飞
    经济周期,太极转化,祸福轮转,都是一种均值回归。

    作者回复: 是的,祸兮福所倚,福兮祸所伏

    2021-08-27
    10
  • Len
    我能说我打王者荣耀经常遇到均值回归,几场连胜后必遇几场连败,反之亦然。。。

    作者回复: 哈哈,其实是背后的匹配算法有讲究,不断给你挑战,又不让你觉得失望不玩了,这样才有成就感

    2021-08-30
    2
    8
  • 那时刻
    均值回归可以对应慎始敬终中敬终。 另外,请问老师,如何判断数据需要均值回归而不是线性回归呢?

    作者回复: 这个是两个不同的概念,均值回归是说现实中永远不像我们预测的那么好或者那么差。而,线性回归是一个预测的算法,只是在理想状态下才会出现

    2021-08-27
    3
  • 不再是入门水平python的小宇
    我刚毕业工作能力很差,换了很多工作,但是一直保持努力精进自己,终于跳槽到一家不错的公司,老板和团队都不错,这就是均值回归吧,保持努力,加上运气等等,不可能一直低谷

    作者回复: 加油,珍惜每次机会,人生里机会并不多的

    2021-11-25
    2
  • 莹子
    郭老师又来鸡汤了 但是这个回归均值的概念却常常被忽略 公司有个红人,老板很欣赏,各种资源支持都给到他,好像他的一切想法都是好的,成功了自然是好,失败了就是走在创新的道路上....... 而其他人中有个爱说大实话但好听的同事,却常常被老板忽视,甚至某些行为偏与之建议相悖 如果老板能够真正理解均值回归,知道用人之长,一视同仁,形成健康的企业氛围就好了

    作者回复: 哈哈哈,是的,所以这个课老板最应该听

    2021-09-24
    2
    1
  • 80分
    均值回归的结果是正态分布。至于为什么会发生均值回归,是因为变量满足这些条件: 1. 相互独立 2. 方差有限 3. 任何一小部分随机变量都不会贡献大部分方差 既然均值回归是必然发生的,那么能否调整回归算法,使其考虑到均值回归的影响?但是均值还有何时回归和回归何处的难点。

    作者回复: 是的,预测不能没有数据支持的情况下乱调整呀,预测结果永远不会那么好,心里有数就好啦

    2021-09-20
    1
  • 进化菌
    人和人之间的差异没有那么大,不存在着优生学,所以该努力还是得努力,不要找太多借口。但是,确实生长在富裕家庭里能得到更多的资源,而这却是我们无法改变的事实,也不必拿这做借口了。
    2021-08-27
    11
  • 均值回归的结论似乎又回到“大数定律和小数陷阱”,对于足够多的样本来说,是均值回归,但是对于独立的个体样本来说,又不一定。
    2021-09-13
    8
  • Jove
    这次多了思维导图,赞
    2021-08-27
    5
  • geigei
    天下大势分久必合合久必分,哈哈 这个应该也是均值回归吧
    2021-10-27
    3
收起评论
显示
设置
留言
24
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部