pyLucene-如何使用BM25相似性代替tf idf

pyLucene-如何使用BM25相似性代替tf idf,lucene,tf-idf,pylucene,Lucene,Tf Idf,Pylucene,据我所知,pyLucene现在也提供BM25相似性。我正在使用pyLucene-4.10.1,但找不到任何关于如何使用BM25而不是tf idf的示例。请指导。尝试使用setSimilarity of IndexSearcher设置检索模型 import lucene from java.nio.file import Paths from org.apache.lucene.store import SimpleFSDirectory from org.apache.lucene.index

据我所知,pyLucene现在也提供BM25相似性。我正在使用pyLucene-4.10.1,但找不到任何关于如何使用BM25而不是tf idf的示例。请指导。

尝试使用setSimilarity of IndexSearcher设置检索模型

import lucene

from java.nio.file import Paths
from org.apache.lucene.store import SimpleFSDirectory
from org.apache.lucene.index import DirectoryReader
from org.apache.lucene.search import IndexSearcher
from org.apache.lucene.search.similarities import BM25Similarity


lucene.initVM(vmargs=['-Djava.awt.headless=true'])
directory = SimpleFSDirectory(Paths.get(INDEX_DIR))
searcher = IndexSearcher(DirectoryReader.open(directory))

searcher.setSimilarity(BM25Similarity())