查找两个文档之间的相似性Lucene

查找两个文档之间的相似性Lucene,lucene,similarity,documents,Lucene,Similarity,Documents,我已经索引了400个文档。然后我想给出两个文档,lucene返回这两个文档之间的相似性。可能吗?提前感谢。简而言之。计算两个文档向量的余弦 是的,但如果有人想要一个好的相似性度量,我认为他需要一个好的词干分析器,并删除停止词。有没有一个简单的方法可以做到这一点?除了Lucene?

我已经索引了400个文档。然后我想给出两个文档,lucene返回这两个文档之间的相似性。可能吗?提前感谢。

简而言之。计算两个文档向量的余弦


是的,但如果有人想要一个好的相似性度量,我认为他需要一个好的词干分析器,并删除停止词。有没有一个简单的方法可以做到这一点?除了Lucene?