pyLucene-如何使用BM25相似性代替tf idf
据我所知,pyLucene现在也提供BM25相似性。我正在使用pyLucene-4.10.1,但找不到任何关于如何使用BM25而不是tf idf的示例。请指导。尝试使用setSimilarity of IndexSearcher设置检索模型pyLucene-如何使用BM25相似性代替tf idf,lucene,tf-idf,pylucene,Lucene,Tf Idf,Pylucene,据我所知,pyLucene现在也提供BM25相似性。我正在使用pyLucene-4.10.1,但找不到任何关于如何使用BM25而不是tf idf的示例。请指导。尝试使用setSimilarity of IndexSearcher设置检索模型 import lucene from java.nio.file import Paths from org.apache.lucene.store import SimpleFSDirectory from org.apache.lucene.index
import lucene
from java.nio.file import Paths
from org.apache.lucene.store import SimpleFSDirectory
from org.apache.lucene.index import DirectoryReader
from org.apache.lucene.search import IndexSearcher
from org.apache.lucene.search.similarities import BM25Similarity
lucene.initVM(vmargs=['-Djava.awt.headless=true'])
directory = SimpleFSDirectory(Paths.get(INDEX_DIR))
searcher = IndexSearcher(DirectoryReader.open(directory))
searcher.setSimilarity(BM25Similarity())