Rdf Marklogic内容泵问题

Rdf Marklogic内容泵问题,rdf,marklogic,dbpedia,n-triples,mlcp,Rdf,Marklogic,Dbpedia,N Triples,Mlcp,我正在尝试使用MarkLogic内容泵将.nt格式的dbPedia数据集加载到MarkLogic中。我使用的是MarkLogic 7,机器上的XDBC服务器运行在端口8005上。我的数据存在于文件persondata_en.nt中,我正在使用以下命令加载它 C:\mlcp-Hadoop2-1.2-1\bin\mlcp import -mode local ^ -host localhost -port 8005 -username admin -password admin ^ -input_f

我正在尝试使用MarkLogic内容泵将.nt格式的dbPedia数据集加载到MarkLogic中。我使用的是MarkLogic 7,机器上的XDBC服务器运行在端口8005上。我的数据存在于文件persondata_en.nt中,我正在使用以下命令加载它

C:\mlcp-Hadoop2-1.2-1\bin\mlcp import -mode local ^
-host localhost -port 8005 -username admin -password admin ^
-input_file_path "C:\dbp\persondata_en.nt" ^
-input_file_type RDF
此命令会导致过早的EOF异常,如下所示

2014-03-18 11:56:28.401 WARNING [1] (AbstractRequestController.runRequest): Error         parsing HTTP headers: Premature EOF, partial header line read: ''
2014-03-18 11:56:28.503 WARNING [1] (AbstractRequestController.runRequest): Error  parsing HTTP headers: Premature EOF, partial header line read: ''
2014-03-18 11:56:28.605 WARNING [1] (AbstractRequestController.runRequest): Error parsing HTTP headers: Premature EOF, partial header line read: ''
2014-03-18 11:56:28.707 WARNING [1] (AbstractRequestController.runRequest): Error parsing HTTP headers: Premature EOF, partial header line read: ''
2014-03-18 11:56:28.809 WARNING [1] (AbstractRequestController.runRequest): Error parsing HTTP headers: Premature EOF, partial header line read: ''
2014-03-18 11:56:28.810 INFO [1] (AbstractRequestController.runRequest): automatic query  retries (5) exhausted, throwing: com.marklogic.xcc.exceptions.ServerConnectionException:    Error parsing
 [Session: user=admin, cb={default} [ContentSource: user=admin, cb={none} [provider:  address=localhost/127.0.0.1:8005, pool=0/64]]]
 [Client: XCC/7.0-20140204]
 com.marklogic.xcc.exceptions.ServerConnectionException: Error parsing HTTP headers:     Premature EOF, partial header line read: ''
 [Session: user=admin, cb={default} [ContentSource: user=admin, cb={none} [provider:  address=localhost/127.0.0.1:8005, pool=0/64]]]
 [Client: XCC/7.0-20140204]

我使用的命令与本教程中示例加载脚本中指定的命令几乎相同。以前有人遇到过这个问题吗?任何帮助都会很好。谢谢

您是否尝试过用
-input\u file\u type rdf
代替
-input\u file\u type rdf
?在各种示例中,我看到小写的“rdf”

通常,“错误解析HTTP头:过早EOF”意味着服务器的响应被中断。这不是一个很常见的错误,但我看到它发生的各种原因

JVM内存不足时会出现一个问题。在这种情况下,它将所有时间都花在垃圾收集上,连接超时。这似乎不太可能,因为persondata应该小于1-GiB,而且mlcp无论如何都不需要整个文件在内存中。但是你可以通过制作一个更小的nt文件来测试这个理论,比如说,1%或10%的行数。如果要查看GC运行的频率,请将
-verbosegc
添加到mlcp脚本中的JVM参数中


我看到的另一个问题是防火墙在N秒后决定关闭连接。另一个是严重超载的服务器,该服务器分页严重或无法让MarkLogic正常工作。

谢谢你们的帮助。我设法找出了问题的原因。我没有正确配置MarkLogic XDBC服务器的设置。我按照文档中的说明重置了服务器,并成功地将三元组插入存储。

数据库中是否有新的三元组?您在服务器日志中看到了哪些消息?