Lucene 或者使用boosting查询术语

Lucene 或者使用boosting查询术语,lucene,Lucene,使用Lucene,我想将索引中的文档与其他文档进行比较。我发现一个很好的方法是将文档作为查询提交。问题是,我需要将术语作为OR环,最困难的部分是使用术语频率提升术语 我认为,如果我修剪文档中的所有空格,并将它们替换为”或“”,lucene将解析并解释它。但是有没有一种最复杂的方法来处理这个问题呢 哪种方法最容易提高术语的频率?看起来你在尝试重新实现Lucene的。看起来你在尝试重新实现Lucene的。事实上,我认为我需要更简单的方法。我只想比较两份使用tf*idf方案的文件,也就是说,如果这些文

使用Lucene,我想将索引中的文档与其他文档进行比较。我发现一个很好的方法是将文档作为查询提交。问题是,我需要将术语作为OR环,最困难的部分是使用
术语频率提升术语

我认为,如果我修剪文档中的所有空格,并将它们替换为
”或“
”,lucene将解析并解释它。但是有没有一种最复杂的方法来处理这个问题呢


哪种方法最容易提高术语的频率?

看起来你在尝试重新实现Lucene的。

看起来你在尝试重新实现Lucene的。

事实上,我认为我需要更简单的方法。我只想比较两份使用tf*idf方案的文件,也就是说,如果这些文件共享非常罕见的术语,我想得到高分。事实上,我认为我需要更简单的东西。我只想比较两个使用tf*idf方案的文档,也就是说,如果这些文档共享非常罕见的术语,我想获得高分。