作者回复: 这里是假设f1和f2相互独立,所以有p(c|f1,f2)=p(c,f1,f2)/(p(f1,f2))=(p(c,f1)p(c,f2))/(p(f1)p(f2))=p(c|f1)p(c|f2)
作者回复: 你可以这么理解,如果f1和f2独立,那么f1不会影响f2的概率分布,包括联合概率p(c,f)和条件概率p(c|f)
作者回复: 是的👌
作者回复: 一般Python或者Spark的机器学习包都有这类的实现,你可以参考。你也可以按照本文的思路实现一个基本版本
作者回复: 大意是对的,WordVec主要是发掘词之间的语义关系,这个我找机会补上
作者回复: 第一张表是指分类出现的概率,因此是以文章为单位来计算的。
作者回复: 嗯,以此类推到其他类就可以了
作者回复: 没错
作者回复: 有好几款,包括中科院出的,上网可以查到一些。不过没有一款最好的,各有优劣
作者回复: 你好,具体是小数变化的哪里不懂?
作者回复: 是的,为了可比较,通常还可以进行归一化
作者回复: 我想你说的是p(c|f1,f2) = p(c|f1)*p(c|f2) ?