Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/343.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java lucene:如何获取查询的发生行_Java_Search_Lucene - Fatal编程技术网

Java lucene:如何获取查询的发生行

Java lucene:如何获取查询的发生行,java,search,lucene,Java,Search,Lucene,我有很多文本文件。每个文本文件都有如下数据: 大数据。。。大数据 另一个大数据 其他一些数据 现在我必须用lucene编写一个代码,当搜索查询匹配时,可以检索整行代码 比如,如果我搜索一些数据,整个第三行都应该被过滤掉 一些其他数据 我已经能够使用spanQuery执行一些操作,但它只返回文档和单词位置。如何从文本文件中获取“真实文本” 如果有参考资料,请提供。我不知道你的意思。如果总是只检索一行就足够了,那么您可能希望每行而不是每文件创建一个文档 然后将仅检索有问题的行。(当然,从行映射回文

我有很多文本文件。每个文本文件都有如下数据:

大数据。。。大数据
另一个大数据
其他一些数据

现在我必须用lucene编写一个代码,当搜索查询匹配时,可以检索整行代码

比如,如果我搜索
一些数据
,整个第三行都应该被过滤掉

一些其他数据


我已经能够使用spanQuery执行一些操作,但它只返回文档和单词位置。如何从文本文件中获取“真实文本”


如果有参考资料,请提供。

我不知道你的意思。如果总是只检索一行就足够了,那么您可能希望每行而不是每文件创建一个
文档


然后将仅检索有问题的行。(当然,从行映射回文件会更复杂。)

我不知道你的意思。如果总是只检索一行就足够了,那么您可能希望每行而不是每文件创建一个
文档


然后将仅检索有问题的行。(当然,从行到文件的映射将更加复杂。)

这主意太棒了。。此外,我认为从行映射回文件并不困难。我会在文档中有一个指向文件的字段,这样做很简单。。请告诉我表演的情况。。谢谢。我做了一些类似的事情,我只索引了电子邮件主题标题。为了进行评估,我创建了数千个文档的60个索引,然后对每个索引运行数百个查询。这总共花费了大约半分钟,包括JavaVM和几个库的加载时间。当然,性能取决于很多因素,所以YMMV。这是一个很棒的主意。。此外,我认为从行映射回文件并不困难。我会在文档中有一个指向文件的字段,这样做很简单。。请告诉我表演的情况。。谢谢。我做了一些类似的事情,我只索引了电子邮件主题标题。为了进行评估,我创建了数千个文档的60个索引,然后对每个索引运行数百个查询。这总共花费了大约半分钟,包括JavaVM和几个库的加载时间。性能当然取决于很多因素,所以YMMV。请看。请看。