Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/go/7.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
TermFreqVector lucene.net_Lucene_Lucene.net - Fatal编程技术网

TermFreqVector lucene.net

TermFreqVector lucene.net,lucene,lucene.net,Lucene,Lucene.net,我可以按如下类别获取文档: IndexSearcher searcher = new IndexSearcher(dir); Term t = new Term("category", "Feline"); Query query = new TermQuery(t); Hits hits = searcher.Search(query); for (int c =

我可以按如下类别获取文档:

IndexSearcher searcher = new IndexSearcher(dir);

                Term t = new Term("category", "Feline");
                Query query = new TermQuery(t);
                Hits hits = searcher.Search(query);

                for (int c = 0; c < hits.Length(); c++)
                {
                    Document d = hits.Doc(c);
                    Console.WriteLine(c + " " + d.GetField("category").StringValue());
                }
IndexSearcher searcher=newindexsearcher(dir);
术语t=新术语(“类别”、“猫”);
查询=新术语查询(t);
Hits=searcher.Search(查询);
对于(int c=0;c
现在我想获取hits中文档的TermFreqVector。我通常会这样做:

for (int c = 0; c < searcher.MaxDoc(); c++)
                {
                    TermFreqVector TermFreqVector = IndexReader.GetTermFreqVector(c, "content");

                    String[] terms = TermFreqVector.GetTerms();//get the terms
                    int[] freqs = TermFreqVector.GetTermFrequencies();//
                }
for(int c=0;c
但是,我不确定在我的场景中如何实现这一点(即,仅为hits中的文档获取它们)。这些文档还有一个db pk

谢谢


Christian

IndexReader.GetTermFreqVector
(“示例中的c”)的第一个参数是文档编号
hits.id(c)
将返回cth结果的id。所以你会做一些类似的事情:

int Id = hits.id(c);
TermFreqVector TermFreqVector = IndexReader.GetTermFreqVector(Id, "content");
// etc.

(附带说明:Hits类已被弃用;您可能希望使用类似于HitCollector的内容或其他搜索重载。)

谢谢。我来看看这个。我正在使用Lucene.Net-可能需要一段时间,直到点击被弃用…@csetzkorn:它在2.9.3中被正式弃用,这就是Lucene.Net所使用的。你是对的,它在3.0之前不会被完全删除。(不管它是否得到官方支持,在任何情况下都是缓慢的。)