• Kevin.zhang🌏
    2018-12-19
    作业:
    对比机器学习、模式识别、数据挖掘、人工智能:
    我的理解是这样的:
    1、机器学习偏向于学习,对潜在的规律分析完成后,再对未来进行预测。
    2、模式识别主要偏工程应用,是对具体的环境和客体的“模式”进行识别。
    3、数据挖掘主要偏应用,是对历史数据进行分析并发现规律,注重数据的价值体现。
    4、人工智能主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作,它涵盖了机器学习、模式识别、数据挖掘等技术。
    以上就是我的理解,还望老师指点!
    展开

    作者回复: 总结的很棒👍机器学习重预测,数据挖掘重解释

     1
     14
  • 韶华
    2018-06-09
    这篇虽然形而上,但是对于系统性切入到机器学习领域还是很有必要的!
    
     3
  • 叫我龙总
    2018-06-13
    学了好几天都是理论,感觉很枯燥,这就是机器学习吗?

    作者回复: 后面会进入具体模型的介绍模块。机器学习和深度学习不一样,不能归到纯粹的工程领域。领会基本的理论对于理解、分析乃至于自己去设计全新的模型和算法都是有指导意义的。

    
     2
  • 你不是我
    2018-06-11
    对机器学习的点从生男生女为切入点,让人眼前一亮。但是,在后面的例子中,似乎这已经接不上下文,在中间段再加一个例子是不是会更好更让人印象深刻一点😊

    作者回复: 感谢你的建议🤝这个承上启下的例子要好好构思一下

    
     1
  • 林彦
    2018-06-10
    数据挖掘过去包含像回归,分类,聚类这些现在由机器学习这种"挖掘"方式找到最佳答案的问题。过去用统计学推导,像贝叶斯推导这种概率论解题方式也可以看作其中一种。机器学习有时更暴力一些,不需要显式解也能发掘规律。通过标签和大量数据来发掘规律这种解题方式在机器学习没流行之前我个人觉得主流的数据挖掘或统计教材着墨不多。以前模式识别,神经网络更多停留在抽象的理论,一个本科或硕士生很少能自己搭出一个应用来解决平时的实际问题。

    作者回复: 你说的很对,数据挖掘偏重解释,所以预测方面不如机器学习。
    除了没有应用场景之外,个人用户更大的困难是没有数据。当然现在情况有所改善,既有现成的数据集可供下载,也可以自己去抓数据。

    
     1
  • 刘強
    2018-06-09
    清宫图看成了春 宫 图,吓了我一跳
    
     1
  • Geek_59
    2020-01-28
    极客时间
    21天打卡行动 41/21
    <<机器学习40讲/03>>学什么与怎么学
    今日所学:
    1,体现出一些切实的规律,也就是某些特征会表现出固定的变化趋势,蕴含着明显的规律性,这种规律性被称为“模式”(pattern)。
    2,模式识别和机器学习实际上有大量的共通之处,严格地将两者区分开来既没方法也没必要;
    3,如果说机器学习侧重于将预先设定的准确率等指标最大化,那模式识别就更注重于潜在模式的提取与解释。
    4,用机器学习解决问题还需要一个条件,就是大量的可用数据(data);一方面,输出结果会受到多个输入特征的共同影响,另一方面,特征与特征之间通常也不是完全独立的,而是存在着相互作用;
    5,什么样的问题才能通过机器学习来解决呢?首先,问题不能是完全随机的,需要具备一定的模式;其次,问题本身不能通过纯计算的方法解决;再次,有大量的数据可供使用;
    6,机器学习的任务,就是使用数据计算出与目标函数最接近的假设,或者说拟合出最精确的模型 。
    7,机器学习中三类特征:具体特征(concrete feature)、原始特征(raw feature)和抽象特征(abstract feature);
    8,机器学习的方法分成分类算法(classification)、回归算法(regression)和标注算法(tagging)三类;
    9,如果训练数据中的每组输入都有其对应的输出结果,这类学习任务就是监督学习(supervised learning),对没有输出的数据进行学习则是无监督学习(unsupervised learning)。
    10,无监督学习可以用于对数据进行聚类或者密度估计,也可以完成异常检测这类监督学习中的预处理操作;
    11,。主动学习是策略导向的学习策略,通过有选择地询问无标签数据的标签来实现迭代式的学习。当数据的标签的获取难度较高时,这种方法尤其适用。
    重点:
    1,机器学习适用于解决蕴含潜在规律的问题;
    2,纯算数问题无需使用机器学习;
    3,机器学习需要大量数据来发现潜在规律;
    4,从输入空间、输出空间、数据标签、学习策略等角度可以对机器学习进行分类。
    展开
    
    
  • ou叮当
    2019-09-07
    也就是说如果我有大量医院的四个月前孕前检查的各项指标的的数据,并且有医院产后的胎儿的性别数据,就可以通过有监督学习通过分类聚类的方式来学习。假设我没有产后数据,就可以通过无监督学习去看看是不是产生几类数据,这时候就知道了有几类数据了,这时候通过有经验的医生或者少有的先验数据就可以得出结果了。是这样的吗?

    作者回复: 有监督的没错,可以用数据训练分类算法,用来预测新的实例。无监督的只能根据数据属性来对数据聚类,但没办法做预测,因为不知道聚类产生的每一类数据到底对应男还是女。

    
    
  • ㄟ忘川.
    2019-03-12
    老师,请问您对迁移学习是否有所研究,有没有考虑开一门关于迁移学习的课程呢?
    
    
  • 司圭
    2018-12-11
    老师有个问题,对用户进行分类,目的看怎么划分用户比较好,目前只有两个字段(完成订单数、最近一次完单日期与昨天的间隔),但是数据量有500多万个,这用什么方法比较好,

    作者回复: 属性数不多,可以考虑两者综合使用。假设订单数有10个取值,间隔也有10个取值,总共就是100个类别。当然,还是要结合你的分类目的来设计。

    
    
  • liyooo
    2018-06-18
    主动学习的概念第一次听说,看来还要提高知识水平啊
    
    
  • shougao
    2018-06-11
    老师您好,非常喜欢您的课,可以在文中加小例子吗?这样更能感受方法的直观作用和目的。比如1.3.5.265.215.209,分成两类。这种

    作者回复: 你的建议很好👍在后面介绍具体模型的时候会有相应的实例的。

    
    
  • guojian Li
    2018-06-10
    怎么判断问题蕴含规律?是否有一些统计工具?

    作者回复: 问题本身可学习性的判断需要先验知识,没有人工干预的机器学习是玩不转的,因为它总是能根据数据过拟合出一些“规律”出来。

    
    
  • guojian Li
    2018-06-10
    机器学习适用于解决蕴含潜在规律的问题;
    ————-
    怎么判断问题是蕴含规律呢? 主观感觉?还有有一数据统计手段?

    作者回复: 特征选择和提取可以在问题可学习性已经确定的基础上筛选出能够体现规律的有效特征。

    
    
  • 青刀快马
    2018-06-09
    就是感觉没弄明白到底要学些什么,以及怎么来学?

    作者回复: 再看看最后的总结

    
    
我们在线,来聊聊吧