12 | 朴素贝叶斯:让AI告诉你,航班延误险该不该买?
刘海丰
该思维导图由 AI 生成,仅供参考
你好,我是海丰。
今天,我们接着来讲一个基础的分类算法,朴素贝叶斯(NBM,Naive Bayesian Model),也可以简称 NB 算法。
你可能想说,贝叶斯我听过,什么叫朴素贝叶斯呢?其实,朴素贝叶斯就是我们在贝叶斯原理的基础上,预先假定了特征与特征之间的相互独立。那特征之间的相互独立是什么意思呢?简单来说,一个人的性别是女性和她是中国国籍这两项特征就是相互独立的,因为她的国籍不会影响到她的性别。那特征之间不相互独立也很好理解了,像是一个人的身高会影响他衣服的尺码,所以身高和衣服的尺码就不是相互独立的。
那特征与特征之间相互独立的好处是什么呢?朴素贝叶斯算法怎么解决分类问题呢?我们又该怎么使用它呢?今天,我们就通过一个预测购买航班延误险的例子,来给你详细讲一讲。
如何理解 朴素贝叶斯 算法?
有的同学可能对贝叶斯算法还不是非常熟悉,或者忘得差不多了,所以在讲朴素贝叶斯算法之前,我们先来说说贝叶斯算法以及相关的基础概念。
1. 贝叶斯的原理
贝叶斯是由一名英国数学家提出来的,贝叶斯就是这个数学家的名字。那它是干什么的呢?
比如说,我们拿到一个长得很大的西瓜,拍一拍它会有咚咚咚的声音,而且这个西瓜的价格还特别贵,那我们就觉得它应该挺甜。虽然这个西瓜不一定是甜的,但是这些经验可以帮助我们在一定概率下找到甜西瓜。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
朴素贝叶斯算法在航班延误险购买预测中的应用是本文的主题。文章首先介绍了贝叶斯原理及相关基础概念,包括条件概率、先验概率和后验概率。随后详细介绍了朴素贝叶斯算法的原理,强调了其基于特征之间相互独立的假设。通过具体案例说明了朴素贝叶斯算法在航班延误险购买预测中的实际应用。文章还探讨了朴素贝叶斯算法的优缺点,指出其适用于简单且条件独立的事件预测,但在面对复杂条件或相关性较强时效果较差。总结中强调了朴素贝叶斯算法的核心原理和适用场景,以及其适合的项目开发成本情况。最后,提出了一个课后讨论问题,引发读者思考。 朴素贝叶斯算法的简单逻辑和适用场景使其成为一种有价值的分类算法,尤其适用于文本处理相关的场景。文章通过生动的案例和简洁的语言,使读者能够快速了解朴素贝叶斯算法的基本原理及应用场景。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《成为 AI 产品经理》,新⼈⾸单¥59
《成为 AI 产品经理》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(14)
- 最新
- 精选
- 悠悠置顶我觉得可能可以从该员工最近的请假情况等来判断(可能还有其他元素,暂时先理清这一个因素),暂定两周内请假3天及以上(事件B)。比较事件B下离职和不离职的概率, P(A):离职的概率; P(B):近两周内请假3天及以上的概率; P(A|B):近两周内请假3天及以上,离职的概率; P(B|A):离职的人中,近两周内请假3天及以上的概率; P(C):不离职的概率 P(C|B):近两周内请假3天及以上,不离职的概率; P(B|C):不离职的人中,近两周内请假3天及以上的概率; P(A|B)=P(B|A)P(A)/P(B) P(C|B)=P(B|C)P(C)/P(B) 若P(A|B)>P(C|B),则离职概率大 若P(A|B)<P(C|B),则不离职概率大
作者回复: 悠悠,分析的好!
2021-01-0822 - Geek_542a30置顶离职率是一个非常复杂的模型,朴素贝叶斯算法过于简单了,我认为不太合适
作者回复: 很认可,首先离职率的预测是一个非常复杂的模型,正常情况来说,只用朴素贝叶斯大概率是不够的。但作为产品经理,要回到场景上看问题,场景不同,选择的模型不同,对于这个问题可以分为两期来考虑。 第一期: 原则:快速响应,从0到1 具体:要结合成本来考量,一般内部部门的诉求样本比较少,并且内部部门对于准确率的接受程度比较大,他们在意的是从无到有,因为启动期没有效果指标参考,可以先用朴素贝叶斯来完成业务方的从无到有需求,做到快速响应; 第二期: 原则:根据实际情况,考虑资源倾斜 具体:这个阶段就要看实际的使用情况了,一般来说,内部部门的项目就到此为止了,但是如果在如众包机构工作,就切实需要投入更多的资源来训练一个模型来解决这个问题。
2021-01-08215 - 我不过是善良离职看似简单,主要原因其实就那么2条:钱给少了、领导不对付;前者可以用同等条件招聘网站薪资平均计算,后者可以用问卷计算。
作者回复: 你是一个合格的产品经理,总最少的资源解决问题
2021-01-1348 - 刘启宇工作年限 性别 岗位 薪资数据 部门 等 可以选几个相对独立的数据进行分析,所以是合适的。
作者回复: 赞同
2021-01-0824 - weiwei我觉得离职预测案例中,难点就是特征之间的独立性。2021-12-313
- 小亮20% * 40% * 30% = 24%?2023-04-04归属地:浙江11
- 热寂能否解答一下:飞机延误和不延误的那张表格,4个概率加起来是0.8,为什么不是1?这4个事件不应该是组成一个全集吗?2022-05-281
- escray贝叶斯就是根据 先验概率 P(A)、P(B) 和 条件概率 P(B|A) 估算 后验概率 P(A|B) 朴素贝叶斯假设所有条件对结果都是独立发生作用的,那么不朴素的呢?如果条件对结果的作用不独立,是不是就没有办法预测了? 飞机延误的例子稍微有一点复杂,看了一会儿才明白,其中 P(A1A2) = P(A1)*P(A2),这也就是说 A1 和 A2 之间是独立的。比如深圳和北京的天气,如果是深圳和广州的话,估计就不独立了。 对于离职概率的计算,个人感觉朴素贝叶斯可能过于简化了。或者说,我感觉对于人的预测,一般很难准确,悠悠的答案可能是比较接近实际情况的,但是如果行业处于风口,跳槽的收益很高,那么就没法预测了。2022-04-13
- 产品部1朴素贝叶斯算法适合分析条件相对独立的场景,而员工多种离职因素不具备独立性,因此比较适合用线性回归算法来预测。2022-04-05
- 澄镜之水从上面飞机延误的公式到下面飞机延误概率值的计算,中间是怎么转换的呀?2022-02-093
收起评论