lucene为大量独特的资源创建了多个文档?
我是lucene搜索的初学者。如果我收集了以下资源: id、名称、{产品列表}、{关键字列表}。如果我想根据名称、产品或关键字进行搜索,我对lucene及其用法有一些疑问: 1) 对于文档创建,我创建了一个具有id、名称、产品(多个值)、关键字(多个值)结构的文档。如果我有1000个唯一的资源,它会创建1000个唯一的文档吗? 2) 此外,如果我将名称和产品字段设置为可搜索字段(作为StringField),那么搜索后,结果是否也会包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?Q>它会创建1000个唯一的文档吗?lucene为大量独特的资源创建了多个文档?,lucene,Lucene,我是lucene搜索的初学者。如果我收集了以下资源: id、名称、{产品列表}、{关键字列表}。如果我想根据名称、产品或关键字进行搜索,我对lucene及其用法有一些疑问: 1) 对于文档创建,我创建了一个具有id、名称、产品(多个值)、关键字(多个值)结构的文档。如果我有1000个唯一的资源,它会创建1000个唯一的文档吗? 2) 此外,如果我将名称和产品字段设置为可搜索字段(作为StringField),那么搜索后,结果是否也会包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?Q
A>Lucene没有“独特性”的概念——它只存在于你的头脑中。或者,将此视为所有文档对于Lucene都是唯一的。如果按这些字段搜索,将返回相关文档 Q>结果是否也包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?
奇怪/不清楚的问题。如果搜索所有文档,您将获得所有文档。如果搜索查询只匹配某些文档,则会返回某些文档。内部结构更为复杂——这完全取决于您如何分析文本。也许你可以给出更多关于用例的具体例子?我想知道我对lucene索引和搜索的理解是否正确。因此,在这种情况下,如果我有1000个资源,lucene将创建多少文档?你可以明确控制将创建多少文档。这将相当于使用
IndexWriter
创建和编写的org.apache.lucene.document.document
实例的数量。如果您为每个资源创建一个文档(这似乎是最合理的),那么是的,将有数千个文档。