作者回复: 是的,理解正确
作者回复: 是的👍
作者回复: 这个问题很好!这主要是从统计的可行性出发,以语音识别为例,我们的语料(或者说标注数据、历史数据)都是给定文本,比如说中文,然后收集用户的发音(如果是中文,发音也就对应是拼音),所以可以很自然的拿到P(中文|拼音)这种概率。
作者回复: 很好的总结,第3点可以使用贝叶斯定理推导出来,你可以尝试一下
作者回复: 我看你另外一个问题,应该是已经理解了“隐藏状态层”和“输出层”的概念,简单的来理解,就是“隐藏层”到“输出层”是有一定概率分布的,不是必然的。如果必然了,就不需要区分这两层了,直接把“输出层”当做“隐藏层”就好了。
也正是因为如此,公式推导使用了条件概率公式。在“隐藏层”的某个状态给定的情况下,出现“输出层”某个输出的概率是多少,以此类推。
作者回复: 不是这个意思。实际上每条出链接上的概率,表示给定出发点,到目标点的概率,是一种条件概率。比如,从A到B的概率是0.1,就是P(B|A)=0.1。所以,不能把这些条件概率相加。
我这里只是示意图,A可能还会链接到其他我没有画在图中的点,从A到所有目标点的概率加起来应该是1。比如从A出发一共到三个点,B,X和Y,P(B|A)=0.1,P(X|A)=0.5,P(Z|A)=0.4,加起来是1
作者回复: 思路是对的👍
作者回复: 后面我会多一些关于公式的解释,帮助理解
作者回复: 涉及到实践的话,要考虑的东西就比较多。作为数学模型,我们只需要知道PageRank的公式,可是如果Web网络的规模相当之大,那么实现的时候就无法只存储在内存之中,就需要考虑磁盘和内存的切换,或者采用分布式系统来利用多台机器的内存,或者是采用近似的优化,降低内存的消耗。
作者回复: 这里容易混淆,举个例子,如果我们想将英文翻译成中文,那么输出层是英文,而隐藏层是中文,我们要看哪种中文的隐藏层,可以输出目标英文的概率最大,那么这个中文是最可能的翻译
作者回复: 对,应该是P(中文|拼音)
作者回复: 分词是其中一步,还有就是对应的翻译。另外,假设咱们要把中文翻译成英文,我理解你说的源语言和目标语言分别对应于中文和英文。如果是这样,需要对调,也就是源语言(中文)是我们所能观测到的输出层,而目标语言(英文)是要分析出的状态层。
作者回复: 不完全是,实际上需要用到贝叶斯定理进行推导,并用马尔科夫假设简化
作者回复: 这里假设,有(1-α)的概率,从当前页面跳转到任何一个其他的页面,假设页面总共有N张,所以就是1/N的概率了。
作者回复: 确实是可以的,我理解PageRank不用高阶是为了减少计算量
作者回复: 对文中的例子,这个理解是对的。至于思考题,我暂时不回答,给其他读者更多的思考机会 😆