• qinggeouye
    2019-03-06
    机器翻译,比如一个中文句子翻译为英文,中文句子可拆分为多个词,每个中文词可能会匹配多个英文单词,一句中文翻译为英文,可能会有多种翻译结果。那么:
    隐藏状态层 -> 多种翻译结果可能性中的一种
    输出层 -> 每个中文词可能匹配多个英文单词

    这样理解不知是否正确?

    作者回复: 是的,理解正确

    
     10
  • Joe
    2019-02-21
    隐马尔科夫模型在语音中的应用,流程是:
    1,根据拼音去找到单个对应的词语,不考虑声调的概率。
    2,再根据词语之间转移的概率,词语对应目标音高的概率,进而求出整个句子输出的概率。概率越大,可能性越高。
    因此第一个词可以是xiangmu 对应语料库的所有词,不一定是四声,可以是香木之类的词语。
    不知道这样理解对不对?

    作者回复: 是的👍

    
     7
  • Thinking
    2019-02-12
    不理解一个地方,由读音推测汉字的过程为什么要算P(xiang(4)mu(4)|项目)概率而不是P(项目|xiang(4)mu(4))概率?隐马尔科夫解决由输出层找到产生输出的隐藏状态层,为什么不换个角度说成由看得到的输入层找到隐藏状态层呢?

    作者回复: 这个问题很好!这主要是从统计的可行性出发,以语音识别为例,我们的语料(或者说标注数据、历史数据)都是给定文本,比如说中文,然后收集用户的发音(如果是中文,发音也就对应是拼音),所以可以很自然的拿到P(中文|拼音)这种概率。

    
     5
  • Temme
    2019-07-11
    学习了之后,又看了几篇隐马尔可夫的一些收获:
    隐马尔科夫适用于,只知道表象(观测层或者输出层),而内部的状态是隐藏的,未知的,可能有无数种的。语音识别分为3步
    1.表象推测出隐藏,比如xiangmu的拼音读音可以推出隐藏的的实际字是项目,也可以是香木,各自有一定的概率,也可以是木香,只不过概率为0。推出概率在一定值以上的,做为隐藏状态。
    2.各自推出隐藏的状态后,这些状态可以组合成各种状态链,比如橡木凯发世间这种,可以想象会有各种诡异的词组,这时候就用到马尔科夫状态转移的方法,筛选出靠谱的词组,得出结论,比如项目转开发转时间,这个状态转移的概率很高。概率在一定值以上的,挑出来作为状态序列。
    3.语音识别只需要一个解。也是隐马尔科夫的关键,隐藏层推出表象层的概率(有点反人类认知,但是贝叶斯告诉我们这个无非是个数学的转换),大概就是,p(隐藏)*p(表象|隐藏)。好像p(表象|隐藏),就是隐藏推表象的概率,其实不然,这里的推出还要考虑到隐藏层本身是个状态转移。
    展开

    作者回复: 很好的总结,第3点可以使用贝叶斯定理推导出来,你可以尝试一下

    
     2
  • 唯她命
    2019-03-05
    老师你好 , “隐藏状态层”产生“输出层”的概率 这句话是什么意思。
    还有 “隐藏状态层”产生“输出层”的概率 那个公式是怎么推导出来的。

    作者回复: 我看你另外一个问题,应该是已经理解了“隐藏状态层”和“输出层”的概念,简单的来理解,就是“隐藏层”到“输出层”是有一定概率分布的,不是必然的。如果必然了,就不需要区分这两层了,直接把“输出层”当做“隐藏层”就好了。
    也正是因为如此,公式推导使用了条件概率公式。在“隐藏层”的某个状态给定的情况下,出现“输出层”某个输出的概率是多少,以此类推。

    
     1
  • 李皮皮皮皮皮
    2019-03-02
    讲马尔可夫链的第一张图中,就是ABC的那种图,链上的概率是如何得出的?
    我的理解是:根据语境中出现的AB,BC这些组合的概率,比如说总共有10个二元组,AB出现了一次,所以A到B的链上概率是0.1。如果按这么理解的话,那么所以的概率之和应该等于1吧。但是我算了一下,图中概率和等于1.1。不知道我理解的对不对,望老师解答😢

    作者回复: 不是这个意思。实际上每条出链接上的概率,表示给定出发点,到目标点的概率,是一种条件概率。比如,从A到B的概率是0.1,就是P(B|A)=0.1。所以,不能把这些条件概率相加。

    我这里只是示意图,A可能还会链接到其他我没有画在图中的点,从A到所有目标点的概率加起来应该是1。比如从A出发一共到三个点,B,X和Y,P(B|A)=0.1,P(X|A)=0.5,P(Z|A)=0.4,加起来是1

    
     1
  • 拉欧
    2019-02-12
    输出层:被翻译语言,隐藏状态层:翻译语言
    比如要翻译 get busy living ,or get busy dying
    输出层为 get busy living ,or get busy dying
    隐藏层可能为:
    1、要么忙于生存,要么赶着去死
    2、忙于活,或忙于死
    。。。
    然后按照隐马尔科夫概率乘积选择概率最大的
    不知道这么理解对不对?
    展开

    作者回复: 思路是对的👍

    
     1
  • 
    2019-02-12
    硬着头皮看完。比如英文翻译目标语言,我认为要翻译的文本的直接看出来的特征(单词包括的意思),单词之间的语法规则和词性,时态是隐藏层。
    数学差看起来就是费劲o(╥﹏╥)o,英文差看不懂最新论文。不清楚大家啥水平,我建议老师多给几个例子好理解些。深刻体会到没多一个公式,少一分看下去的兴趣。

    作者回复: 后面我会多一些关于公式的解释,帮助理解

    
     1
  • 唔多志
    2020-01-31
    希望老师可以说一下这些模型在实际的工程项目中,主要的难点在哪里?比如说,在运用语言模型来解决 PageRank 的实践中,在那个步骤会是难点。

    作者回复: 涉及到实践的话,要考虑的东西就比较多。作为数学模型,我们只需要知道PageRank的公式,可是如果Web网络的规模相当之大,那么实现的时候就无法只存储在内存之中,就需要考虑磁盘和内存的切换,或者采用分布式系统来利用多台机器的内存,或者是采用近似的优化,降低内存的消耗。

    
    
  • y欧尼酱
    2020-01-08
    输出层 是输出的文字(被正确翻译的句子) 隐藏层句子中每个字 单词 背后的意思 , 连在一起组成的顺通句子。 可以这么理解吧。

    作者回复: 这里容易混淆,举个例子,如果我们想将英文翻译成中文,那么输出层是英文,而隐藏层是中文,我们要看哪种中文的隐藏层,可以输出目标英文的概率最大,那么这个中文是最可能的翻译

    
    
  • 总统老唐
    2019-12-23
    黄老师,看到你回复“Thinking"同学的问题,不确定是不是笔误,应该是P(拼音|中文)的概率很好拿到吧,你好像说反了

    作者回复: 对,应该是P(中文|拼音)

    
    
  • teddytyy
    2019-12-18
    输出层是目标语言的分词,状态层是源语言的分词,这么建模对吗?

    作者回复: 分词是其中一步,还有就是对应的翻译。另外,假设咱们要把中文翻译成英文,我理解你说的源语言和目标语言分别对应于中文和英文。如果是这样,需要对调,也就是源语言(中文)是我们所能观测到的输出层,而目标语言(英文)是要分析出的状态层。

    
    
  • 南边
    2019-12-13
    尝试推导一下音频解析的公式:
    
    
  • Paul Shan
    2019-09-06
    思考题
    输出层是原语言的句子,隐藏状态层是目标语言的单词和句子,我们要求解的是找到隐藏层中的句子,使得输出层(原语句,也就是被翻译的句子)出现概率最大。
    
    
  • Paul Shan
    2019-09-06
    隐式马尔可夫的公式是不是计算y1 y2 y3 出现的联合概率,如果是的话,感觉少乘了两个p(x 1),不知道是不是这样.

    作者回复: 不完全是,实际上需要用到贝叶斯定理进行推导,并用马尔科夫假设简化

    
    
  • Paul Shan
    2019-09-06
    Pagerank公式可以分成两部分,第一部分,根据入链接,计算出每个入链接对该页面的PageRank贡献。第二部分,是把这个值和1/N,用α和1-α加权。第一部分体现的是其他指向该网页贡献。但是第二部分,我看不懂,老师能否解释一下,为什么要和1/N加权,多谢!

    作者回复: 这里假设,有(1-α)的概率,从当前页面跳转到任何一个其他的页面,假设页面总共有N张,所以就是1/N的概率了。

    
    
  • 凝神寂照
    2019-07-20
    老师您好,对于PageRank的web拓扑图,网页A链接网页B,网页B链接网页C,一个网页只和前一个网页有关,这是一个一阶的马尔科夫链,但实际中网页A也可能链接C吧,为什么PageRank不用高阶的马尔科夫链呢?

    作者回复: 确实是可以的,我理解PageRank不用高阶是为了减少计算量

    
    
  • 唯她命
    2019-03-05
    老师 语音识别的例子
    隐藏层 :项目开发时间 或者 橡木开发事件
    输出层 : xiang(四声)mu(四声) kai(一声)fa(一声) shi(四声)jian(四声)
                   xiang(一声)mu(-声) kai(一声)fa(一声) shi(四声)jian(四声)
                   xiang(四声)mu(-声) kai(一声)fa(一声) shi(二声)jian(四声)
                   等等所有可能的音调
    不知道这么理解对不对?

    另外还望老师解答下课后思考题
    展开

    作者回复: 对文中的例子,这个理解是对的。至于思考题,我暂时不回答,给其他读者更多的思考机会 😆

    
    
我们在线,来聊聊吧