数据分析思维课
郭炜
前易观 CTO
38045 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 40 讲
数据分析思维课
15
15
1.0x
00:00/00:00
登录|注册

12 | 精确率与置信区间:两种预测,你究竟应该相信哪一个?

置信度
神经网络
关联
分析
聚类
置信区间计算过程
自动驾驶算法
置信区间
召回率
精确率
准确率
人工智能
数据挖掘
统计分析
算法模型
附录
课后思考
小结
取舍的艺术
衡量算法模型的重要指标
数据算法模型
统计分布
算法模型
算法定义
数据算法基础

该思维导图由 AI 生成,仅供参考

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
从今天开始,我们就要进入数据算法基础部分了。一说到算法,很多人都会觉得神秘、复杂、高大上……那究竟什么是算法呢?
官方把算法定义为一个计算过程,这个过程输入某一个值或一个值的集合,终会产生一个值和一个值的集合作输出,这就是一个算法。官方的说法比较抽象,简单来说,你可以把算法当成一个具有科学依据的算命箱子,你给这个箱子输入你的面相、体重生辰八字,最终它会根据你的需求给你算出一个很有可能的结果,比如最近你买比特币会发大财,生的孩子是男孩一类的。这个输入输出的箱子就是一个算法,箱子里面装的我们就叫做算法模型。
看到这,你可以停个五秒钟想一想,这种感觉是不是似曾相识?我们前面讲了很多的统计分布,假如我们知道收入和投资是成正相关的,我们是不是就可以知道在未来某一个投入情况下,收入会有多少了?之前我们介绍的统计分布是不是算法模型呢?
是的,我们在数据分析基础里介绍的各种分布,就是算法模型的一种。其实数据算法模型包括很多大类,简单说来可以分为统计分析、数据挖掘和人工智能几大类,聚类、分析、关联、神经网路等等很多种算法。我们有非常多的算法模型,到底哪个算得准呢?今天这节课,我就给你讲几个衡量这些算法模型的重要指标:准确率、精确率、召回率和置信区间。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文介绍了数据算法模型的衡量指标,包括准确率、精确率、召回率和置信区间。通过生动的比喻和具体的例子,深入浅出地介绍了这些指标在衡量算法模型准确性和全面性方面的作用。文章强调了在实际场景中需要做出取舍,结合业务场景选择最合适的算法。此外,还介绍了置信区间的概念及其计算过程。最后,鼓励读者在工作和生活中运用这些指标,共同提高算法的精确率、召回率和置信区间。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《数据分析思维课》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(30)

  • 最新
  • 精选
  • 莹子
    精准率就是你找到的马,找对的占比 召回率就是所有的马,你找出来多少 类似于其他场景: 招揽的顾客中,真正有消费的客户占比,就是精准率 一个市场中,所有有意向的客户中,已经来消费的,就是召回率 那么置信率与置信空间在现实市场环境中,有哪些应用呢?

    作者回复: 给你一个市场调研问卷,你一定要问问这两个指标,要不就容易被忽悠啦

    2021-09-24
    12
  • trust
    老师,请问附录中是怎么一下子看出来样本是正态分布哒,如果不是正态分布,还可以这么用不

    作者回复: 不能,数据分布是算法之前,数据探索第一步要做的

    2021-09-27
    2
    7
  • 进化菌
    准确率和精确率,其实就相当于射箭中靶子的概率,准确率说的是整体上射中靶心的概率,而精确率是规避不射中靶心下精准的概率。召回率大概就是将错误修正后的概率吧。 置信区间,有点像别人问,你有几层把握拿下Ta~

    作者回复: 有这么点意思,哈哈

    2021-08-23
    3
  • 那时刻
    关于AUC 曲线、F1 Score、PR 曲线、增益和提升图 AUC曲线与ROC曲线,F1,PR曲线,机器学习中有应用,在应用中作为评价模型的指标。麻烦老师能再解释一下吗? 另外增益和提升图,不知应用场景是什么?

    作者回复: 这些内容需要讲2节课啦,需要好好整理下。整体来讲是算法专业同学要深入了解的,可以学下极客时间的算法课,里面是有介绍的。

    2021-08-23
    2
    2
  • 不再是入门水平python的小宇
    准确率、精确率、召回率、置信区间一定要结合不同的业务场景去看,而不是割裂的单独看某个指标,在金融科技领域,用户做消费贷,一个重要的因素是减少坏账、逾期率,控制风险,避免资质差的用户太多,但是控制风险不是说没有逾期,就要保证准确率和召回率达到一个相对最优的程度。

    作者回复: 是的!

    2021-11-25
  • Juha
    老师,想要问一个问题,就是置信度和置信区间,是不是数据服从正态分布才可以,因为95%实际上是正态分布下的 均值 +/- 1.96*标准差 区间范围数据的面积占钟形总面积的95%,如果不服从正态分布的话,实际上这个 均值 +/- 1.96*标准差 区间范围数据的面积占总面积的比例 是不是就不是95%了。

    作者回复: 是的,抽样这节课也说过类似的事情

    2021-10-16
    2
  • 莹子
    l老师 ,我们现在在做大宗商品的每日价格预测 预测的方法是:1、参考昨天市场行情价格 2、结合公司的库存、客户签约价格等因素 制定出公司的指导价格。 现在选用了8个模型去跑出去,看看当日公司指导价格和当日市场价格进行误差分析,但是没有一个模型一直表现的很好,总是今天这个模型误差小,明天那个模型误差小。不知道该选择哪个模型去指导? 这种情况下,我们还应该做些什么?

    作者回复: 你基于的数据准确么?我朋友做这方面的时候,真的会派人去一些仓库盯着车和库存的,有时候要综合考虑问题

    2021-10-13
    2
  • 纸老虎
    这儿的概念在图像识别里会使用,应用场景上还有哪些场景会用到?谢谢

    作者回复: 分类算法都会用到。

    2021-10-09
  • 睡前不玩手机
    准确率1 鹿 99 马的例子, 如果指鹿为鹿 1 次, 指马为马 99 次, 准确率是 1% 还是 100%?

    作者回复: 准确率要看预测目标,鹿1%,马99%

    2021-10-09
    3
  • 那么问题来了,以审核为例,查全意味着误杀概率高即安全但体验不好;查准则意味着体验好但是不安全网站被封杀;那么查全和查准的关系是数学里的什么关系?如何用公式表示呢?

    作者回复: 课程里的公式就是准确公式,总量是一个,其实是此消彼长

    2021-09-10
收起评论
显示
设置
留言
30
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部