成为 AI 产品经理
刘海丰
京东高级架构师
23717 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 38 讲
成为 AI 产品经理
15
15
1.0x
00:00/00:00
登录|注册

12 | 朴素贝叶斯:让AI告诉你,航班延误险该不该买?

独立性假设限制
资源占用少
逻辑简单
延误概率计算
数据收集
后验概率
先验概率
条件概率
朴素贝叶斯适用性讨论
开发成本
应用场景
核心原理
缺点
优点
预测航班延误
公式解释
独立性假设
相关概念
事件判断的原理
离职概率分析
总结
优缺点
应用案例
朴素贝叶斯原理
贝叶斯原理
课后讨论
朴素贝叶斯算法

该思维导图由 AI 生成,仅供参考

你好,我是海丰。
今天,我们接着来讲一个基础的分类算法,朴素贝叶斯(NBM,Naive Bayesian Model),也可以简称 NB 算法。
你可能想说,贝叶斯我听过,什么叫朴素贝叶斯呢?其实,朴素贝叶斯就是我们在贝叶斯原理的基础上,预先假定了特征与特征之间的相互独立。那特征之间的相互独立是什么意思呢?简单来说,一个人的性别是女性和她是中国国籍这两项特征就是相互独立的,因为她的国籍不会影响到她的性别。那特征之间不相互独立也很好理解了,像是一个人的身高会影响他衣服的尺码,所以身高和衣服的尺码就不是相互独立的。
那特征与特征之间相互独立的好处是什么呢?朴素贝叶斯算法怎么解决分类问题呢?我们又该怎么使用它呢?今天,我们就通过一个预测购买航班延误险的例子,来给你详细讲一讲。

如何理解 朴素贝叶斯 算法?

有的同学可能对贝叶斯算法还不是非常熟悉,或者忘得差不多了,所以在讲朴素贝叶斯算法之前,我们先来说说贝叶斯算法以及相关的基础概念。

1. 贝叶斯的原理

贝叶斯是由一名英国数学家提出来的,贝叶斯就是这个数学家的名字。那它是干什么的呢?
比如说,我们拿到一个长得很大的西瓜,拍一拍它会有咚咚咚的声音,而且这个西瓜的价格还特别贵,那我们就觉得它应该挺甜。虽然这个西瓜不一定是甜的,但是这些经验可以帮助我们在一定概率下找到甜西瓜。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

朴素贝叶斯算法在航班延误险购买预测中的应用是本文的主题。文章首先介绍了贝叶斯原理及相关基础概念,包括条件概率、先验概率和后验概率。随后详细介绍了朴素贝叶斯算法的原理,强调了其基于特征之间相互独立的假设。通过具体案例说明了朴素贝叶斯算法在航班延误险购买预测中的实际应用。文章还探讨了朴素贝叶斯算法的优缺点,指出其适用于简单且条件独立的事件预测,但在面对复杂条件或相关性较强时效果较差。总结中强调了朴素贝叶斯算法的核心原理和适用场景,以及其适合的项目开发成本情况。最后,提出了一个课后讨论问题,引发读者思考。 朴素贝叶斯算法的简单逻辑和适用场景使其成为一种有价值的分类算法,尤其适用于文本处理相关的场景。文章通过生动的案例和简洁的语言,使读者能够快速了解朴素贝叶斯算法的基本原理及应用场景。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(14)

  • 最新
  • 精选
  • 悠悠
    置顶
    我觉得可能可以从该员工最近的请假情况等来判断(可能还有其他元素,暂时先理清这一个因素),暂定两周内请假3天及以上(事件B)。比较事件B下离职和不离职的概率, P(A):离职的概率; P(B):近两周内请假3天及以上的概率; P(A|B):近两周内请假3天及以上,离职的概率; P(B|A):离职的人中,近两周内请假3天及以上的概率; P(C):不离职的概率 P(C|B):近两周内请假3天及以上,不离职的概率; P(B|C):不离职的人中,近两周内请假3天及以上的概率; P(A|B)=P(B|A)P(A)/P(B) P(C|B)=P(B|C)P(C)/P(B) 若P(A|B)>P(C|B),则离职概率大 若P(A|B)<P(C|B),则不离职概率大

    作者回复: 悠悠,分析的好!

    2021-01-08
    22
  • Geek_542a30
    置顶
    离职率是一个非常复杂的模型,朴素贝叶斯算法过于简单了,我认为不太合适

    作者回复: 很认可,首先离职率的预测是一个非常复杂的模型,正常情况来说,只用朴素贝叶斯大概率是不够的。但作为产品经理,要回到场景上看问题,场景不同,选择的模型不同,对于这个问题可以分为两期来考虑。 第一期: 原则:快速响应,从0到1 具体:要结合成本来考量,一般内部部门的诉求样本比较少,并且内部部门对于准确率的接受程度比较大,他们在意的是从无到有,因为启动期没有效果指标参考,可以先用朴素贝叶斯来完成业务方的从无到有需求,做到快速响应; 第二期: 原则:根据实际情况,考虑资源倾斜 具体:这个阶段就要看实际的使用情况了,一般来说,内部部门的项目就到此为止了,但是如果在如众包机构工作,就切实需要投入更多的资源来训练一个模型来解决这个问题。

    2021-01-08
    2
    15
  • 我不过是善良
    离职看似简单,主要原因其实就那么2条:钱给少了、领导不对付;前者可以用同等条件招聘网站薪资平均计算,后者可以用问卷计算。

    作者回复: 你是一个合格的产品经理,总最少的资源解决问题

    2021-01-13
    4
    8
  • 刘启宇
    工作年限 性别 岗位 薪资数据 部门 等 可以选几个相对独立的数据进行分析,所以是合适的。

    作者回复: 赞同

    2021-01-08
    2
    4
  • weiwei
    我觉得离职预测案例中,难点就是特征之间的独立性。
    2021-12-31
    3
  • 小亮
    20% * 40% * 30% = 24%?
    2023-04-04归属地:浙江
    1
    1
  • 热寂
    能否解答一下:飞机延误和不延误的那张表格,4个概率加起来是0.8,为什么不是1?这4个事件不应该是组成一个全集吗?
    2022-05-28
    1
  • escray
    贝叶斯就是根据 先验概率 P(A)、P(B) 和 条件概率 P(B|A) 估算 后验概率 P(A|B) 朴素贝叶斯假设所有条件对结果都是独立发生作用的,那么不朴素的呢?如果条件对结果的作用不独立,是不是就没有办法预测了? 飞机延误的例子稍微有一点复杂,看了一会儿才明白,其中 P(A1A2) = P(A1)*P(A2),这也就是说 A1 和 A2 之间是独立的。比如深圳和北京的天气,如果是深圳和广州的话,估计就不独立了。 对于离职概率的计算,个人感觉朴素贝叶斯可能过于简化了。或者说,我感觉对于人的预测,一般很难准确,悠悠的答案可能是比较接近实际情况的,但是如果行业处于风口,跳槽的收益很高,那么就没法预测了。
    2022-04-13
  • 产品部1
    朴素贝叶斯算法适合分析条件相对独立的场景,而员工多种离职因素不具备独立性,因此比较适合用线性回归算法来预测。
    2022-04-05
  • 澄镜之水
    从上面飞机延误的公式到下面飞机延误概率值的计算,中间是怎么转换的呀?
    2022-02-09
    3
收起评论
显示
设置
留言
14
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部