Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Indexing solr不会索引所有文档_Indexing_Solr_Lucene_Dbpedia - Fatal编程技术网

Indexing solr不会索引所有文档

Indexing solr不会索引所有文档,indexing,solr,lucene,dbpedia,Indexing,Solr,Lucene,Dbpedia,我从dbpedia获得了一组记录,每天1-365次。将这些唯一记录索引到solr。在每次迭代中,将近2000个文档被索引 我发送给solr的记录总数为449872,solr上的文档总数为“numFound”:428411 我将maxDocs限制设置为100000 对此有什么想法吗?日志中是否有错误?可能的原因1。您是否在流程完成后提交(您使用的是哪个solr版本?)。如果没有,请尝试/update?commit=true,然后检查numFound 2。您是否在模式中使用“id”字段,该字段也是“

我从dbpedia获得了一组记录,每天1-365次。将这些唯一记录索引到solr。在每次迭代中,将近2000个文档被索引

我发送给solr的记录总数为
449872
,solr上的文档总数为
“numFound”:428411

我将
maxDocs
限制设置为100000


对此有什么想法吗?

日志中是否有错误?可能的原因1。您是否在流程完成后提交(您使用的是哪个solr版本?)。如果没有,请尝试/update?commit=true,然后检查numFound 2。您是否在模式中使用“id”字段,该字段也是“uniqueKey”?如果是,那么您可以检查您的所有文档是否都有唯一的ID。如果任何文档具有相同的id,它们将被新文档覆盖。3.正如TMBT所说,检查solr日志文件是否存在错误。要启用索引的详细日志记录,请检查solrconfig文件中的情况是否属实-true@jay:yes
commit=true
存在,我将
link
作为唯一键,并且我仅为唯一记录编制索引。日志不显示任何错误。是否存在显示所有以前日志记录的日志文件?我检查示例文件夹中的日志文件,但没有错误,“链接”字段的字段类型是什么?您是否也尝试过启用infostream并在索引后检查其中的错误?