机器学习 40 讲
王天一
工学博士,副教授
35375 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 46 讲
机器学习 40 讲
15
15
1.0x
00:00/00:00
登录|注册

03 | 学什么与怎么学

主动学习
在线学习
批量学习
无监督学习
监督学习
二分类问题
抽象特征
原始特征
具体特征
区别
共通之处
纯算数问题无需使用机器学习
机器学习适用于解决蕴含潜在规律的问题
学习策略
输出结果
输入特征
需要大量数据
蕴含潜在规律
与机器学习的关系
与机器学习的关系
与机器学习的关系
适用范围
分类
解决问题特点
人工智能
数据挖掘
模式识别
机器学习

该思维导图由 AI 生成,仅供参考

男孩还是女孩?这是个问题!
在中国人的生活中,生男生女可谓兹事体大,多少幸福与烦恼都因此而起。那么有没有办法提前做出准确的预测呢?当然有啦!通常在怀孕 4 个月时,胎儿的性别就可以通过 B 超得到准确的判断了,所以只要问一问医生轻松搞定。但是出于职业道德和执业法规的要求,医生一般是不会透露胎儿性别的。想要在怀孕的早期判断,终归还是要依赖祖辈流传下来的经验。
可祖辈的经验多了去了,流传最广的可能就是“酸儿辣女”:如果准妈妈突然爱喝柠檬水说明怀了个男孩;突然爱吃老干妈就说明怀了个女孩。可实际上,“酸儿辣女”只是一种互文的说法,表达的是怀孕对饮食口味的影响,想要以此为据预测胎儿的性别纯属无稽之谈。相比之下,另一条经验还更靠谱一些:准妈妈的肚子如果是尖形,则胎儿很可能是个男孩;肚子是圆形的话就更可能是个女孩。至少在我个人的生活经验之中,这条规则的准确率超过了 80%。
剥去所有的伦理道德外延,所谓的“生男生女”完全可以看成一个纯粹的科学问题。虽然说胎儿性别不可能以决定性的方式影响母体的物理特征,但终究会有一定的参考价值。通俗说就是虽说男孩肚子尖女孩肚子圆一定不会以 100% 的概率发生,但 70% 的置信度恐怕还是有的,这相比于纯属瞎猜的对半概率就是个不小的进步,也就意味着肚子形状的特征提供了一定的信息。除此之外,胎儿性别还可能对母体的其他变化产生一些不起眼但确实存在的影响,比如说民间流传的脚部浮肿或者肚脐突出,这些变化都可以作为预测胎儿性别的特征来看待。
除了肉眼可见的物理特征外,更精确的特征是医学上的定量指标。相关的具体信息在这里我就不班门弄斧了。但可以确定的是,胎儿的性别势必会对母体的内分泌特性产生不同的影响,从而在指标上体现出不同趋势的变化。而这些怀孕早期的指标变化反过来又可以为倒推胎儿性别提供有力的证据,从而实现“生男还是生女”的预测。
那么问题来了,能不能通过机器学习来解决这个问题呢?
能不能用机器学习来解决,要从下面这几个角度来分析。首先,预测胎儿的性别不是预测婴儿的活动,没人能知道婴儿的下一声啼哭会发生在什么时候,即使你知道他的血压肺活量脉搏等所有的生理指标,还是没有办法去预测。但胎儿的性别不一样,它可以体现出一些切实的规律,也就是某些特征会表现出固定的变化趋势,蕴含着明显的规律性,这种规律性被称为“模式”(pattern)。
机器学习能够解决的问题必然会包含某些显式或者隐式的模式,没有模式的问题就不能通过机器学习解决。完全随机的问题是不可能被求解,也不可能被学习的,就像我们永远也没法预测示波器下一时刻的本底噪声一样。
一提到模式,你可能会一下子联系到另一个专业词汇——模式识别(pattern recognition)。模式识别和机器学习实际上有大量的共通之处,严格地将两者区分开来既没方法也没必要。如果非要找到些不同的话,模式识别是被更广泛地应用在计算机视觉(computer vision)等专门领域之中的专门概念,工程上的意义更浓一些。如果说机器学习侧重于将预先设定的准确率等指标最大化,那模式识别就更注重于潜在模式的提取与解释
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入探讨了机器学习在预测胎儿性别方面的应用。作者首先介绍了传统的预测方法,如“酸儿辣女”说法和肚子形状的关联,然后探讨了机器学习在解决这一问题上的潜力。文章指出,机器学习能够解决具有一定模式、无法通过纯计算方法解决且有大量可用数据支持的问题。机器学习的分类算法、回归算法和标注算法等不同类型的特征在解决实际问题中的应用条件和方法也得到了详细阐述。此外,文章还介绍了监督学习和无监督学习的区别,以及批量学习、在线学习和主动学习等不同的学习策略。总的来说,本文为读者提供了对机器学习技术特点的深入了解,强调了机器学习适用于解决蕴含潜在规律的问题,需要大量数据来发现潜在规律,并且从输入空间、输出空间、数据标签、学习策略等角度可以对机器学习进行分类。文章内容丰富,深入浅出,对于想要了解机器学习在实际问题中的应用条件和方法的读者具有很高的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《机器学习 40 讲》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(18)

  • 最新
  • 精选
  • Kevin.zhang🌏
    作业: 对比机器学习、模式识别、数据挖掘、人工智能: 我的理解是这样的: 1、机器学习偏向于学习,对潜在的规律分析完成后,再对未来进行预测。 2、模式识别主要偏工程应用,是对具体的环境和客体的“模式”进行识别。 3、数据挖掘主要偏应用,是对历史数据进行分析并发现规律,注重数据的价值体现。 4、人工智能主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,它涵盖了机器学习、模式识别、数据挖掘等技术。 以上就是我的理解,还望老师指点!

    作者回复: 总结的很棒👍机器学习重预测,数据挖掘重解释

    2018-12-19
    2
    36
  • 龙哥
    学了好几天都是理论,感觉很枯燥,这就是机器学习吗?

    作者回复: 后面会进入具体模型的介绍模块。机器学习和深度学习不一样,不能归到纯粹的工程领域。领会基本的理论对于理解、分析乃至于自己去设计全新的模型和算法都是有指导意义的。

    2018-06-13
    2
    3
  • 林彦
    数据挖掘过去包含像回归,分类,聚类这些现在由机器学习这种"挖掘"方式找到最佳答案的问题。过去用统计学推导,像贝叶斯推导这种概率论解题方式也可以看作其中一种。机器学习有时更暴力一些,不需要显式解也能发掘规律。通过标签和大量数据来发掘规律这种解题方式在机器学习没流行之前我个人觉得主流的数据挖掘或统计教材着墨不多。以前模式识别,神经网络更多停留在抽象的理论,一个本科或硕士生很少能自己搭出一个应用来解决平时的实际问题。

    作者回复: 你说的很对,数据挖掘偏重解释,所以预测方面不如机器学习。 除了没有应用场景之外,个人用户更大的困难是没有数据。当然现在情况有所改善,既有现成的数据集可供下载,也可以自己去抓数据。

    2018-06-10
    2
  • 你不是我
    对机器学习的点从生男生女为切入点,让人眼前一亮。但是,在后面的例子中,似乎这已经接不上下文,在中间段再加一个例子是不是会更好更让人印象深刻一点😊

    作者回复: 感谢你的建议🤝这个承上启下的例子要好好构思一下

    2018-06-11
    1
  • shougao
    老师您好,非常喜欢您的课,可以在文中加小例子吗?这样更能感受方法的直观作用和目的。比如1.3.5.265.215.209,分成两类。这种

    作者回复: 你的建议很好👍在后面介绍具体模型的时候会有相应的实例的。

    2018-06-11
    1
  • ou叮当
    也就是说如果我有大量医院的四个月前孕前检查的各项指标的的数据,并且有医院产后的胎儿的性别数据,就可以通过有监督学习通过分类聚类的方式来学习。假设我没有产后数据,就可以通过无监督学习去看看是不是产生几类数据,这时候就知道了有几类数据了,这时候通过有经验的医生或者少有的先验数据就可以得出结果了。是这样的吗?

    作者回复: 有监督的没错,可以用数据训练分类算法,用来预测新的实例。无监督的只能根据数据属性来对数据聚类,但没办法做预测,因为不知道聚类产生的每一类数据到底对应男还是女。

    2019-09-07
  • 司圭
    老师有个问题,对用户进行分类,目的看怎么划分用户比较好,目前只有两个字段(完成订单数、最近一次完单日期与昨天的间隔),但是数据量有500多万个,这用什么方法比较好,

    作者回复: 属性数不多,可以考虑两者综合使用。假设订单数有10个取值,间隔也有10个取值,总共就是100个类别。当然,还是要结合你的分类目的来设计。

    2018-12-11
  • guojian Li
    怎么判断问题蕴含规律?是否有一些统计工具?

    作者回复: 问题本身可学习性的判断需要先验知识,没有人工干预的机器学习是玩不转的,因为它总是能根据数据过拟合出一些“规律”出来。

    2018-06-10
  • guojian Li
    机器学习适用于解决蕴含潜在规律的问题; ————- 怎么判断问题是蕴含规律呢? 主观感觉?还有有一数据统计手段?

    作者回复: 特征选择和提取可以在问题可学习性已经确定的基础上筛选出能够体现规律的有效特征。

    2018-06-10
  • 青刀快马
    就是感觉没弄明白到底要学些什么,以及怎么来学?

    作者回复: 再看看最后的总结

    2018-06-09
收起评论
显示
设置
留言
18
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部