Java 如何使用Lucene索引字幕?

Java 如何使用Lucene索引字幕?,java,lucene,Java,Lucene,我正在尝试使用Lucene实现一个搜索引擎。我有字幕作为语料库。我分析了它们并将它们转换为以下格式: timestamp0 sentence0 timestamp1 sentence1 timestamp2 sentence2 . . . 我只使用文档中的句子实现了一个基本的索引和搜索应用程序。然而,我想要实现的是让Lucene也返回句子的时间戳。换句话说,我希望我的搜索引擎能够在电影中出现某个短语时给出答案。我能用Lucene做到吗?提前感谢。当然可以,只需将日期作为单独的字段存

我正在尝试使用Lucene实现一个搜索引擎。我有字幕作为语料库。我分析了它们并将它们转换为以下格式:

timestamp0   sentence0
timestamp1   sentence1
timestamp2   sentence2
.
.
.

我只使用文档中的句子实现了一个基本的索引和搜索应用程序。然而,我想要实现的是让Lucene也返回句子的时间戳。换句话说,我希望我的搜索引擎能够在电影中出现某个短语时给出答案。我能用Lucene做到吗?提前感谢。

当然可以,只需将日期作为单独的字段存储在文档中即可。问题是什么?文档中有很多行,因此有很多时间戳和句子。我看到了文档包含几个不同字段的示例。然而,我有一个文档,每行有两个相同的字段。你能告诉我一个类似的例子吗?你认为是一个Lucene文件。它不一定是一个文件,它应该是您想要搜索和检索的数据的逻辑单元。对于这个用例,我建议“文档”是一行,文档包含一个时间戳和一个文本行(当然还有其他字段,如果合适的话)。这是一个好主意。我可以使用Lucene对搜索结果进行分组,还是应该手动分组?在搜索结果中,我想向用户显示摘要为几行匹配字幕的电影。如果你有电影标题字段,你可以按该字段排序,而不是按相关性排序。如果您的查询相对简单。失去相关性排序可能不是什么大问题。请参阅Lucene的,使用方式如下:
indexSearcher.search(查询、maxResults、新排序(新SortField(“title”、SortField.Type.STRING));