• zhuxiaozhu167
    2017-12-23
    假设一个神经网络中包含 1000 个参数,每个参数又有 10 种可能的取值,对于每一组训练 / 测试集就有 1000的10次方
    应该是10的1000次方吧?

    作者回复: 没错,谢谢指正!

    
     19
  • 孙伟贤
    2017-12-23
    这一篇终于跟通俗易懂了,谢谢王博士
    
     9
  • qiang.li
    2017-12-23
    还是要学好概率统计和线性代数啊,体会到了数学的意义了!
    
     5
  • 秦龙君
    2017-12-29
    学习了,这篇好看懂。
    
     4
  • Snail@AI_ML
    2019-01-15
    王博好,文中标注问题部分提到的变量序列能否解释一下?谢谢。文末提到的阿尔法狗我有一个看法:刚学到pca,貌似可以解释一下,用了降维策略,这样就可以从少量的数据中获得一个比较好模型,不知对否?

    作者回复: 可以举个例子:给出一个句子,判断其中每个词的词性,动词名词还是形容词。每个词的词性再形成一个序列,这就是输出的变量序列,也就是标记序列。这是自然语言处理的常见任务。
    PCA本身只是对数据的降维,而且在降维过程中数据的信息还会损失。至于能不能通过降维数据得到较好的模型,可能要具体情况具体分析。

    
     2
  • caocao
    2018-04-03
    alghago zero 除了有监督学习,还有 图像识别的使用吧,不然 怎么观察棋谱 并进行运算呢,所以1.图像识别 可以使用 已成熟的CNN 技术
    2.如果我们有图像识别的应用,可以 使用 正确率高,性能好的 GoogleLenet 模型 做调整 适应我们的业务,使用已有的 框架 应该是 效率 很高的,运行也很快
    3.如果有条件 加上gpu,不够 可以 再考虑tpu,这样 运行会超快。



    有个问题 请教 王老师:监督学习的 生成方法 和 判别方法 有哪些具体方面的应用

    还有 王老师 谈到 交叉验证,没有 涉及到 正则化
    展开

    作者回复: 是否使用图像识别我不太清楚,因为棋盘本身是个大坐标系,棋子的位置实际上就是二维的坐标。
    生成方法学习的是联合分布,典型算法是朴素贝叶斯;判别方法学习的是条件分布,典型算法是逻辑回归。
    交叉验证是验证模型性能的技术,正则化是处理模型本身的技术,两个不是一个范畴。在深度学习里有关于正则化的统一论述,线性回归中也会涉及一点正则化。

    
     2
  • Kongk0ng
    2017-12-24
    如果可以的话,希望能标注关键名词对应的英文

    作者回复: 这个问题曾经考虑过,最后还是没有在正文里放英文。专栏最后会给出中英文一个索引。

    
     2
  • fsc2016
    2018-12-15
    alghago 是不是强化学习了,他没有标记结果,只是不停的与环境交互,然后根据获取奖励判断自己做出哪一步对自己获取奖励最多了
    
     1
  • Geek_59
    2019-12-24
    打卡第五天(5/21):
    <<人工智能基础课07>>机器学习概率论
    回答老师问题:在图像识别领域中,高识别率的背后是大量被精细标记的图像样本,而对数以百万计的数字图像进行标记无疑需要耗费大量人力。借鉴近期 AlphaGo Zero 的成功经验,如何降低机器学习中的人工干预程度,同时提升算法效率呢?
    在一定样本中特征向量,要均衡分布,在测试误差中不可过拟合或者欠拟合,在交叉验证中,样本数据都有很好的表现,这样的经筛选的样本中,也不需要过多监学习,这样训练的模型,一个是想达到的,另一个也降低了监督演习的成本,总结,我们要控制样本的数据,也要控制模型的收敛范围;
    今日所学:
    什么是机器学习?从大量现象中提取反复出现的规律与模式。这一过程在人工智能中的实现就是机器学习。
    从形式化角度定义,如果算法利用某些经验使自身在特定任务类上的性能得到改善,就可以说该算法实现了机器学习。而从方法论的角度看,机器学习是计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的学科。
    机器学习中出现的名词 :属性(指某一个对象的描述性质),这个取值叫属性值;
    不同的属性值有序排列得到的向量就是数据,也叫实例。
    每一组属性值的集合都是这个空间中的一个点,因而每个实例都可以视为特征空间中的一个向量,即特征向量。
    根据输入输出类型的不同,预测问题可以分为以下三类。分类问题:输出变量为有限个离散变量,当个数为 2 时即为最简单的二分类问题;
    回归问题:输入变量和输出变量均为连续变量;
    标注问题:输入变量和输出变量均为变量序列。
    而误差性能就成为机器学习的重要指标之一;
    误差可以进一步分为训练误差和测试误差(泛化误差)两类;
    测试误差则反映了学习器对未知的测试数据集的预测能力,是机器学习中的重要概念.
    在数据样本中不可出现过拟合现象,过拟合出现的原因通常是学习时模型包含的参数过多,从而导致训练误差较低但测试误差较高,与过拟合对应的是欠拟合。如果说造成过拟合的原因是学习能力太强,造成欠拟合的原因就是学习能力太弱,以致于训练数据的基本性质都没能学到。
    通过交叉验证:不同模型中平均测试误差最小的模型也就是最优模型,
    经过验证:受学习方式的影响,效果较好的学习算法执行的都是监督学习的任务,监督学习的任务就是在假设空间中根据特定的误差准则找到最优的模型,根据学习方法的不同,监督学习可以分为生成方法与判别方法两类;
    生成方法是根据输入数据和输出数据之间的联合概率分布确定条件概率分布 P(Y|X),这种方法表示了输入 X 与输出 Y 之间的生成关系;判别方法则直接学习条件概率分布 P(Y|X) 或决策函数 f(X),这种方法表示了根据输入 X 得出输出 Y 的预测方法。
    两相对比,生成方法具有更快的收敛速度和更广的应用范围,判别方法则具有更高的准确率和更简单的使用方式。
    今日总结:机器学习是计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的学科;
    根据输入输出类型的不同,机器学习可分为分类问题、回归问题、标注问题三类;
    过拟合是机器学习中不可避免的问题,可通过选择合适的模型降低其影响;
    监督学习是目前机器学习的主流任务,包括生成方法和判别方法两类。
    展开
    
    
  • 吴凌华
    2019-10-30
    学海无涯,也就是说只要学,不要想山头的事了
    
    
  • 吴祥龙
    2018-03-30
    王博,监督学习是基于已知类别的训练数据进行学习,而AlphaGo zero并不借助人类棋谱数据(棋谱数据我理解就是训练数据),而只是依靠棋谱规则做判定,为何说它还是脱不开机器学习的范畴。我理解棋谱规则就像是检验函数,并不是训练数据啊。

    作者回复: 你说的很对,zero不是基于数据的学习,更像是人类启发式的下法。但不管是数据学习还是启发式学习,都需要将最终结果反馈给算法。胜负分类,而不是棋谱规则(最早的alphago好像就不需要规则),才是监督信息。如果只是让zero自己去下,不去管棋局的输赢,他也不会进化到今天的程度。

    
    
  • wolfog
    2018-01-17
    这篇好理解多了,加油
    
    
  • 刘祯
    2018-01-13
    看来我们目前的技术条件,对无监督学习领域有很多的前景和展望,目前更多的是弱人工智能,基于现有行业经验与已有数据,通过开源平台来实现效率与应用升级。我一直在想,无监督学习是一种怎样的存在。

    希望老师能够在下篇文章中加上对上次课后思考题的开放式答案或是思考方向,我们可能有更多的思路去发挥。

    作者回复: 这么说吧,假如我买了肉买了菜,不看菜谱,完全靠手感炒菜,感觉淡了就多加盐,感觉甜了就少放糖,多做几次直到找到合口味的做法,就是无监督学习。

    对问题的定位并不是练习题,很多问题也没有固定的答案,能引发更多关于主题和方法的思考,它的价值就体现了。

    
    
我们在线,来聊聊吧