07 机器学习 | 数山有路,学海无涯:机器学习概论
该思维导图由 AI 生成,仅供参考
- 深入了解
- 翻译
- 解释
- 总结
机器学习概论:如何让计算机识别特征? 机器学习是一门基于数据构建概率统计模型,并运用模型对数据进行预测与分析的学科。它通过提取反复出现的规律与模式来改善算法在特定任务上的性能。在机器学习中,数据被描述为对象某些性质的属性,属性的取值称为属性值,不同的属性值有序排列得到的向量就是数据,也叫实例。这些属性值构成了特征空间,每个实例都可以视为特征空间中的一个向量,即特征向量。根据特征向量对输入数据进行分类就能够得到输出。 然而,机器学习中也存在着过拟合和欠拟合的问题。为了对测试误差做出更加精确的估计,一种广泛使用的方法是交叉验证,通过将数据切分成若干子集,让不同的子集分别组成训练集与测试集,并在此基础上反复进行训练、测试和模型选择,达到最优效果。参数的取值也是影响模型性能的重要因素,因此调参是机器学习中重要的工程问题。 监督学习是机器学习的主流任务,包括生成方法和判别方法两类。生成方法是根据输入数据和输出数据之间的联合概率分布确定条件概率分布,而判别方法则直接学习条件概率分布或决策函数。在图像识别领域中,如何降低机器学习中的人工干预程度,同时提升算法效率是一个重要的挑战。 总的来说,机器学习是一门通过数据构建概率统计模型,并运用模型对数据进行预测与分析的学科。在实际应用中需要注意过拟合和欠拟合问题,并进行参数调优和模型选择以达到最佳效果。
《人工智能基础课》,新⼈⾸单¥59
全部留言(19)
- 最新
- 精选
- 天问假设一个神经网络中包含 1000 个参数,每个参数又有 10 种可能的取值,对于每一组训练 / 测试集就有 1000的10次方 应该是10的1000次方吧?
作者回复: 没错,谢谢指正!
2017-12-23231 - Kongk0ng如果可以的话,希望能标注关键名词对应的英文
作者回复: 这个问题曾经考虑过,最后还是没有在正文里放英文。专栏最后会给出中英文一个索引。
2017-12-247 - 听天由己看来我们目前的技术条件,对无监督学习领域有很多的前景和展望,目前更多的是弱人工智能,基于现有行业经验与已有数据,通过开源平台来实现效率与应用升级。我一直在想,无监督学习是一种怎样的存在。 希望老师能够在下篇文章中加上对上次课后思考题的开放式答案或是思考方向,我们可能有更多的思路去发挥。
作者回复: 这么说吧,假如我买了肉买了菜,不看菜谱,完全靠手感炒菜,感觉淡了就多加盐,感觉甜了就少放糖,多做几次直到找到合口味的做法,就是无监督学习。 对问题的定位并不是练习题,很多问题也没有固定的答案,能引发更多关于主题和方法的思考,它的价值就体现了。
2018-01-135 - Snail@AI_ML王博好,文中标注问题部分提到的变量序列能否解释一下?谢谢。文末提到的阿尔法狗我有一个看法:刚学到pca,貌似可以解释一下,用了降维策略,这样就可以从少量的数据中获得一个比较好模型,不知对否?
作者回复: 可以举个例子:给出一个句子,判断其中每个词的词性,动词名词还是形容词。每个词的词性再形成一个序列,这就是输出的变量序列,也就是标记序列。这是自然语言处理的常见任务。 PCA本身只是对数据的降维,而且在降维过程中数据的信息还会损失。至于能不能通过降维数据得到较好的模型,可能要具体情况具体分析。
2019-01-1524 - caocaoalghago zero 除了有监督学习,还有 图像识别的使用吧,不然 怎么观察棋谱 并进行运算呢,所以1.图像识别 可以使用 已成熟的CNN 技术 2.如果我们有图像识别的应用,可以 使用 正确率高,性能好的 GoogleLenet 模型 做调整 适应我们的业务,使用已有的 框架 应该是 效率 很高的,运行也很快 3.如果有条件 加上gpu,不够 可以 再考虑tpu,这样 运行会超快。 有个问题 请教 王老师:监督学习的 生成方法 和 判别方法 有哪些具体方面的应用 还有 王老师 谈到 交叉验证,没有 涉及到 正则化
作者回复: 是否使用图像识别我不太清楚,因为棋盘本身是个大坐标系,棋子的位置实际上就是二维的坐标。 生成方法学习的是联合分布,典型算法是朴素贝叶斯;判别方法学习的是条件分布,典型算法是逻辑回归。 交叉验证是验证模型性能的技术,正则化是处理模型本身的技术,两个不是一个范畴。在深度学习里有关于正则化的统一论述,线性回归中也会涉及一点正则化。
2018-04-0323 - 吴祥龙王博,监督学习是基于已知类别的训练数据进行学习,而AlphaGo zero并不借助人类棋谱数据(棋谱数据我理解就是训练数据),而只是依靠棋谱规则做判定,为何说它还是脱不开机器学习的范畴。我理解棋谱规则就像是检验函数,并不是训练数据啊。
作者回复: 你说的很对,zero不是基于数据的学习,更像是人类启发式的下法。但不管是数据学习还是启发式学习,都需要将最终结果反馈给算法。胜负分类,而不是棋谱规则(最早的alphago好像就不需要规则),才是监督信息。如果只是让zero自己去下,不去管棋局的输赢,他也不会进化到今天的程度。
2018-03-301 - 孙伟贤这一篇终于跟通俗易懂了,谢谢王博士2017-12-2313
- qiang.li还是要学好概率统计和线性代数啊,体会到了数学的意义了!2017-12-2311
- 秦龙君学习了,这篇好看懂。2017-12-295
- 孔祥红 Hunter分类问题和回归问题可以理解,感觉打标签也是分类问题啊,为什么打标签单独一类。2021-04-213