作者回复: 是的,结合这多个技术来实现
作者回复: 其实是相同的,假设K是字典里所有词条的总数,那么两个向量的维度都是K,对于没有出现的词条,分量的值都是0,所以通常文档和查询向量都是稀疏向量,很多0分量。在计算夹角余弦的时候,0的分量都忽略不算了,所以时间复杂度会降低。这里再补充说明一下,如果向量存储使用哈希表,时间复杂度也可以降低到O(m),假设m<<n