Apache 使用solr DIH时数据不匹配

Apache 使用solr DIH时数据不匹配,apache,tomcat,solr,solrj,solrcloud,Apache,Tomcat,Solr,Solrj,Solrcloud,我正在尝试使用DIH将文档从另一个solr拉入solr。 SolrA有10k个文档,但当我将数据拉入SolrB时,SolrB只有9k个文档。 Num Docs:9k,Max Doc:10k。我已经在下面附上了我的DIH xml。 导入到干净的core或collection后,不同的maxDocs和numDocs编号通常是由于文档被覆盖造成的-因为id中存在重复值(或不同的uniqueKey字段,如果配置).不同的maxDoc和NUMDOC通常是由重复的ID/uniqueKey字段条目造成的,因为

我正在尝试使用DIH将文档从另一个solr拉入solr。 SolrA有10k个文档,但当我将数据拉入SolrB时,SolrB只有9k个文档。 Num Docs:9k,Max Doc:10k。我已经在下面附上了我的DIH xml。


导入到干净的core或collection后,不同的maxDocs和numDocs编号通常是由于文档被覆盖造成的-因为
id
中存在重复值(或不同的
uniqueKey
字段,如果配置).

不同的maxDoc和NUMDOC通常是由重复的ID/uniqueKey字段条目造成的,因为新文档覆盖了旧文档。问题出在我们这边。我们的核心中有一些重复记录。感谢回复。