作者回复: 慢慢享用,嚼碎了再吞。
作者回复: 你一定是个学霸,向你致敬。
1. 这里的聚类是指的传统数据挖掘中的聚类。基于距离或者密度等。如kmeans。
2. 停用词要去掉。lda在预测阶段也要迭代的,而不是计算相似度。
3. 你若理解了,就是晴天。
作者回复: 知识星球(原来叫小密圈)搜ResysChina。
作者回复: 用Word2vec跑出一个结果你就明白了,设定k维的话,你会得到一个k维向量,每个维度上都有值的。
作者回复: 1.是
2.是
3.用你文本中出现的词,去查询通过word2vec计算得到的相似词,从而实现了“扩展”,原来只有两个词,现在增加了几个相似词,变成了4个词。
作者回复: 看情况。
作者回复: 文中有详细介绍。后续图书中有例子。
作者回复: 谢谢你的建议,采纳到图书中。
作者回复: 这种场景下,用户也更有耐心一些,可以多向用户询问他的诉求,更像一个辅助决策系统,而不是一个纯粹的推荐系统。
作者回复: 谢谢。