• Float
    2018-06-05
    按照频率学派,由最大似然估计写出似然函数L=p^5(1-p)^3,令一阶导=0得出p=5/8,Bob要连赢三局才能反败为胜,则Bob获胜的概率为(3/8)^3。

    作者回复: Bingo!

    
     33
  • Tiger
    2019-01-07
    分享个人的学习总结,不对的地方请老师指正:
        频率主义认为参数本身是固定的,只是我们不知道,而数据是关于参数的不完全的信息,这就需要我们通过某种手段(比如极大似然法)利用数据找到最优参数。又由于数据是随机的,所以每使用一组不同的数据,找到的参数都不同,但这与参数本身是固定的并不矛盾。这是因为受噪声等因素的影响,数据并非参数的真实反映(否则就可以把固定的参数找到),存在风险,而要计算风险,需要已知数据的真实分布,而数据的真实分布又依赖于参数,这似乎就陷入了一个“先有鸡还是先有蛋”的悖论,为了解决这个悖论,引入经验风险,用训练数据的分布替代真实分布,使得风险可以被计算(这时的风险就称为经验风险),那么通过最小化经验风险就可以找出最优的参数。

    作者回复: 总结得很到位!

     1
     11
  • 快乐的小傻子
    2018-06-06
    数学是基础,概率论和统计学要补补咯
    
     5
  • 【芋道源码】
    2018-06-05
    第二小节有点难……

    作者回复: 具体问题是?

    
     2
  • 行者
    2018-11-21
    看来真的得好好补补数学了、看到数学公式一脸懵
    
     1
  • 晴子
    2018-10-15
    L=p^5(1-p)^3, 对L求一阶导,怎么求出P=3/8

    作者回复: 先对L求对数,再对对数求一阶导,就容易得出了。

    
     1
  • 明臻
    2018-10-13
    置信区间的概率是不是写错了,应该是1-阿尔法。

    作者回复: 感谢细致的阅读👍对置信区间的数学定义定然是1-\alpha,但文章里写的并非严格定义,而是对概念的直观理解,相当于对置信区间的意义做个解释。这时说有100*(1-\alpha)枪打中看着就有些别扭了。当然,这里的\alpha有一些误导性,换一个符号会更恰当。

    
     1
  • velly
    2018-09-29
    参数定义是什么,不怎么理解。

    作者回复: 参数就是决定模型特性的系数,一般是未知的,需要利用数据来估计。像直线y=ax+b,a和b就是参数。

    
     1
  • 朱沛
    2018-06-22
    大学数学没学好的是不是应该先补数学?

    作者回复: 是的,理解原理需要线代和概率,做算法需要最优化。

    
     1
  • never_giveup
    2018-06-10
    说下个人的对最后问题理解,p是待估计的参数 ,5:3是给出的数据。最大似然使在p条件下产生数据的可能性最大,进而求极值算出p。

    作者回复: 没毛病!

    
     1
  • 洪漫楷
    2018-06-08
    没有图帮助理解的吗

    作者回复: 这一篇没有,后面会有的

    
     1
  • .Yang
    2018-06-05
    我勒个去,看到一半跟不上了

    作者回复: 具体问题是?

    
     1
  • Ronnyz
    2020-02-03
    Bob单局获胜的概率为:3/8 ,接下来需要三局连胜:(3/8)^3
    
    
  • Geek_59
    2020-01-26
    极客时间
    21天打卡行动 39/21
    <<机器学习40讲/01>>频率视角下的机器学习
    今日所学:
    1,“概率”(probability)这个基本概念存在着两种解读方式,它们分别对应着概率的频率学派(Frequentist)和贝叶斯学派(Bayesian);
    2,机器学习(machine learning)是一门研究通过计算的手段利用经验来改善系统自身性能的学科;
    3,频率学派口中的概率表示的是事件发生频率的极限值,它只有在无限次的独立重复试验之下才有绝对的精确意义;
    4,概率是一个确定的值,并不会受单次观察结果的影响。
    5,频率统计理论的核心在于认定待估计的参数是固定不变的常量,讨论参数的概率分布是没有意义的;而用来估计参数的数据是随机的变量,每个数据都是参数支配下一次独立重复试验的结果;
    6,解释:一方面,根据这些不精确的数据就可以对未知参数的精确取值做出有效的推断;另一方面,数据中包含的只是关于参数不完全的信息,所以从样本估计整体就必然会产生误差。
    7,统计学的核⼼任务之一是根据从总体中抽取出的样本,也就是数据来估计未知的总体参数。参数的最优估计可以通过样本数据的分布,也就是采样分布;
    8,频率统计最常使用的最优化方法,就是最大似然估计(maximum likelihood estimation)。
    9,如何来度量作为随机变量的估计值和作为客观常量的真实值之间的偏差呢?置信区间(confidence interval)就是频率学派给出的答案。
    10,置信区间的意义在于划定了真值的取值范围,真实的参数会以一定的概率 α 落入根据样本计算出的置信区间之内;
    11,频率主义解决统计问题的基本思路如下:参数是确定的,数据是随机的,利用随机的数据推断确定的参数,得到的结果也是随机的;
    12,将频率主义“参数确定,数据随机”的思路应用在机器学习当中,得到的就是统计机器学习;
    13,和参数相关的信息全部来源于数据,输出的则是未知参数唯一的估计结果,这是统计机器学习的核心特征。
    14,经验风险(empirical risk),用训练数据的经验分布替换掉原始表达式中数据的真实分布;
    重点:
    1,频率学派认为概率是随机事件发生频率的极限值;
    2, 频率学派执行参数估计时,视参数为确定取值,视数据为随机变量;
    3,频率学派主要使用最大似然估计法,让数据在给定参数下的似然概率最大化;
    4,频率学派对应机器学习中的统计学习,以经验风险最小化作为模型选择的准则。
    展开
    
    
  • 墨雨
    2019-10-15
    我,一脸懵逼……
    
    
  • ttttt
    2019-09-20
    上代码:python3 安装sympy包,pip install sympy
    from sympy import *
    # 定义符号p
    p = Symbol('p')
    L = p**5 * (1-p)**3
    # 求导
    d_L = diff(L, p)
    # 解方程
    res = solve(d_L, p)
    # res = [0, 5/8, 1]
    展开

    作者回复: 这是最大似然的解法

    
    
  • 游戏人生
    2019-05-31
    求解似然函数的对数,就可以将乘法运算转换为加法运算,中(θ_i-θ)^2/2σ^2 多了一个1/2吧,应该是

    (θ_i-θ)^2/σ^2,不是log⁡L 是ln⁡L吧。

    作者回复: 1/2那里感谢指正,log和ln只是差一个底数,其实底数是多少都不影响。

    
    
  • WS
    2019-05-18
    观测数据sita的概率分布式子,看不懂,能解释一下吗?

    作者回复: \theta指固定的真实值,\theta_i是在真实值的基础上加了个高斯噪声,所以条件概率就是高斯分布的形式。

    
    
  • 浓眉和叶孤橙
    2019-04-23
    王老师,您好,我想问下,我现在学习概率图模型很吃力,有没有比较好的学习资料推荐,适合初学者?谢谢王老师

    作者回复: 吃力恐怕不是你自己的问题,而是这个方向本身难度就很大,参考资料也不多。比较好的就是koller那本大书,但不适合自学,其他值得推荐的恐怕也没什么了……

    
    
  • 方得
    2019-03-26
    还是是统计学专业,感觉有点蒙,但是大概还是了解的。
    
    
我们在线,来聊聊吧