Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何将.xml格式的wikipedia文件索引到solr中_Xml_Solr_Indexing_Wikipedia - Fatal编程技术网

如何将.xml格式的wikipedia文件索引到solr中

如何将.xml格式的wikipedia文件索引到solr中,xml,solr,indexing,wikipedia,Xml,Solr,Indexing,Wikipedia,我想把维基百科的xml文件索引到Solr中 但我得到一个错误,它无法索引。Solr对xml文件有特定的格式。我更改了schema.xml和data config.xml文件,以适应wikipedia文件的标记 但它仍然无法为文件编制索引。我的实际意图是索引wikipedia,它是一个30GB的xml文件 如何将所有维基百科文件索引到Solr中? 基本上,您可以使用DataImportHandler和一些XPath从Wikipedia XML中提取您关心的元数据,并将其放入扁平的Solr字段列表中

我想把维基百科的xml文件索引到Solr中

但我得到一个错误,它无法索引。Solr对xml文件有特定的格式。我更改了
schema.xml
data config.xml
文件,以适应wikipedia文件的标记

但它仍然无法为文件编制索引。我的实际意图是索引wikipedia,它是一个30GB的xml文件

如何将所有维基百科文件索引到Solr中?


基本上,您可以使用
DataImportHandler
和一些XPath从Wikipedia XML中提取您关心的元数据,并将其放入扁平的Solr字段列表中。

我尝试过,但它不起作用。。。。该文件已提交,但当我搜索它时,它找不到任何文件。您确定该文件在其中吗?当您搜索
*:*
时会发生什么?当我搜索时,它不会显示任何结果,即使是:因为没有任何内容获得indexedOkay,请再为您进行一次理智检查。添加文件后是否正在执行
操作大多数Solr库和包装器都会使这变得非常简单。我在这个链接中解决了同样的问题。我希望有帮助。