32 | 从有限到无限:高斯过程
王天一
该思维导图由 AI 生成,仅供参考
上一讲中我基于高斯分布介绍了建模连续型分布的高斯网络,其中所用到的多元高斯分布是一元高斯分布的扩展与推广。但在多元高斯分布中,变量的数目依然是有限的。如果像傅里叶变换(Fourier transform)那样,将无数个服从高斯概率的随机变量叠加到一起,这个在向量空间上形成的高斯分布就变成了函数空间上的高斯过程。
在概率论和统计学中,高斯过程(Gaussian process)是由出现在连续域上的无穷多个随机变量所组成的随机过程,不管连续域是时间还是空间,在上面定义的无穷维向量都可以看成是个函数(function)。高斯过程的高斯性(Gaussianity)指的是这无穷多个随机变量联合起来共同服从无穷维高斯分布,如果从中取出一部分变量,这些变量的边际分布也是高斯形式的。
不妨假设 是个高斯过程。从空间尺度上看,如果在定义域中任取出一些点 ,那么这些点的联合分布就是多元的高斯分布。更重要的是,这样的性质对于定义域上的任何子集都成立,也就是不管如何取点、取多少点,这些随机变量的高斯性都能够一致地保持。从时间尺度上看,即使每次都抽取相同的点,随机过程的特性依然决定了样本每次独立的实现都会有所差异,但是在统计意义上,同一个自变量在多次抽取中得到的结果也是满足高斯分布的。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
高斯过程是一种用于建模连续函数空间的随机过程,由无穷多个随机变量组成,具备强大的拟合能力。与一般频率主义方法不同,高斯过程中的预测结果是完整的概率分布,而不是点估计。在高斯过程回归中,通过定义特征映射将数据在高维空间中表示,并应用贝叶斯回归分析。高斯过程选择高斯分布做先验,符合最大熵原理,适用于贝叶斯主义的方法。与支持向量机、神经网络等模型相比,高斯过程具有独特的统计特性和应用优势。在实际应用中,高斯过程可通过等价核、似然概率和高斯先验与其他模型联系起来。此外,高斯过程在Scikit-learn中有相关模块,可用于回归和分类问题。文章还提到了高斯过程中均值函数对结果的影响,值得进一步探讨。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《机器学习 40 讲》,新⼈⾸单¥59
《机器学习 40 讲》,新⼈⾸单¥59
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(2)
- 最新
- 精选
- 林彦均值函数不为0就会影响高斯过程产生的曲线的分布。比如一个线性上升的均值函数对应的多元高斯分布曲线会有线性上升趋势。
作者回复: 简单来说,直接使用零均值会让置信区间越拉越大,预测的不确定性也就越来越大。随着测试数据离训练数据越来越远,预测结果的波动会逐渐变得强烈。
2018-09-09 - ifelse学习打卡2023-06-18归属地:浙江
收起评论