Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/docker/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
lucene为大量独特的资源创建了多个文档?_Lucene - Fatal编程技术网

lucene为大量独特的资源创建了多个文档?

lucene为大量独特的资源创建了多个文档?,lucene,Lucene,我是lucene搜索的初学者。如果我收集了以下资源: id、名称、{产品列表}、{关键字列表}。如果我想根据名称、产品或关键字进行搜索,我对lucene及其用法有一些疑问: 1) 对于文档创建,我创建了一个具有id、名称、产品(多个值)、关键字(多个值)结构的文档。如果我有1000个唯一的资源,它会创建1000个唯一的文档吗? 2) 此外,如果我将名称和产品字段设置为可搜索字段(作为StringField),那么搜索后,结果是否也会包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?Q

我是lucene搜索的初学者。如果我收集了以下资源: id、名称、{产品列表}、{关键字列表}。如果我想根据名称、产品或关键字进行搜索,我对lucene及其用法有一些疑问: 1) 对于文档创建,我创建了一个具有id、名称、产品(多个值)、关键字(多个值)结构的文档。如果我有1000个唯一的资源,它会创建1000个唯一的文档吗? 2) 此外,如果我将名称和产品字段设置为可搜索字段(作为StringField),那么搜索后,结果是否也会包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?

Q>它会创建1000个唯一的文档吗?
A>Lucene没有“独特性”的概念——它只存在于你的头脑中。或者,将此视为所有文档对于Lucene都是唯一的。如果按这些字段搜索,将返回相关文档

Q>结果是否也包含(ScoreDocs包含)与我搜索的文本完全相同的文档集?

奇怪/不清楚的问题。如果搜索所有文档,您将获得所有文档。如果搜索查询只匹配某些文档,则会返回某些文档。内部结构更为复杂——这完全取决于您如何分析文本。也许你可以给出更多关于用例的具体例子?

我想知道我对lucene索引和搜索的理解是否正确。因此,在这种情况下,如果我有1000个资源,lucene将创建多少文档?你可以明确控制将创建多少文档。这将相当于使用
IndexWriter
创建和编写的
org.apache.lucene.document.document
实例的数量。如果您为每个资源创建一个文档(这似乎是最合理的),那么是的,将有数千个文档。