Lucene:single的多个文档;资源“;

Lucene:single的多个文档;资源“;,lucene,full-text-indexing,Lucene,Full Text Indexing,我这里的模型是在线课程。每门课程都有一个id号、一个标题,并且可以有不同数量的内容文件(大型html文件)。我尝试使用以下方案在Lucene中表示它们(每一行都是一个文档): 课程:“1”,标题:“Java简介” 课程:“1”,内容:“第1章:基础…” 课程:“1”,内容:“第2章:收藏…” 课程:“2”,标题:“Java网络” 课程:“2”,内容:“第一部分:插座…” 课程:“3”,题目: 但是现在,假设我需要让Lucene给我所有的课程(只有id),标题中有“Java”,部分内容中有“c

我这里的模型是在线课程。每门课程都有一个id号、一个标题,并且可以有不同数量的内容文件(大型html文件)。我尝试使用以下方案在Lucene中表示它们(每一行都是一个文档):

  • 课程:“1”,标题:“Java简介”
  • 课程:“1”,内容:“第1章:基础…”
  • 课程:“1”,内容:“第2章:收藏…”
  • 课程:“2”,标题:“Java网络”
  • 课程:“2”,内容:“第一部分:插座…”
  • 课程:“3”,题目:
但是现在,假设我需要让Lucene给我所有的课程(只有id),标题中有“Java”,部分内容中有“collections”。诸如
title:java和content:collections
之类的查询将不起作用,因为信息被拆分为多个文档

有人能给我推荐一些替代的表示或查询技术来解决这个问题吗?请注意,我不能将所有内容合并到一个文件中,并将其与标题一起索引到同一文档中,因为有些章节是在创建课程后添加的


提前感谢。

我还没有尝试过,但请查看索引时间或查询时间联接:

这里有一个关于它的演示: