Marklogic 通过MLCP摄取存档中存储的XML

Marklogic 通过MLCP摄取存档中存储的XML,marklogic,marklogic-8,mlcp,Marklogic,Marklogic 8,Mlcp,使用以下命令通过MLCP导入存档中存储的XML文档时: mlcp import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_file_type archive -username admin -password admin -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/mod

使用以下命令通过MLCP导入存档中存储的XML文档时:

mlcp import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_file_type archive -username admin -password admin -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/" 
我收到以下错误:

18/08/10 11:09:41 INFO contentpump.LocalJobRunner: Content type: XML 
18/08/10 11:09:41 INFO contentpump.FileAndDirectoryInputFormat: Total input paths to process : 2 
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Error getting input splits: 
18/08/10 11:09:41 ERROR contentpump.LocalJobRunner: Not type information in Archive name
我使用的是MarkLogic 8.0-7.1


有人知道这个错误吗?

输入文件类型
archive
指的是使用MLCP归档导出创建的MLCP归档zip文件(
-output\u type archive

我想你是想用
-input\u compressed
来代替。比如:

mlcp.bat import -mode local -host localhost -input_file_path "D:\xmlworkflow\test" -input_compressed -username xxx -password yyy -port 8000 -database Documents -input_file_pattern ".*/*.zip" -output_uri_prefix "/modules/"
要有选择地导入特定的文件,我建议使用一个转换,如果该文件应该被摄取,则通过
$content
,如果跳过,则通过
()
(空序列)

有关MLCP转换的文档可在此处找到:


输入文件类型
archive
指使用MLCP归档导出创建的MLCP归档zip文件。也许你想改用
-input\u compressed
?你用
marklogic-9
marklogic-7
标记了它。您使用的是哪个版本的MarkLogic?Dave,我使用的是MarkLogic 8.0-7.1.mlcp导入-模式本地-主机本地主机-输入文件路径“D:\xmlworkflow\test”-输入文件类型存档-用户名管理员-密码管理员-端口8000-数据库文档-输入文件模式“*/*.zip”-输出uri前缀“/模块/”18/08/10 11:09:41信息内容泵。LocalJobRunner:内容类型:XML 18/08/10 11:09:41信息内容泵。文件和目录输入格式:进程的总输入路径:2 18/08/10 11:09:41错误内容泵。LocalJobRunner:获取输入拆分时出错:18/08/10 11:09:41错误内容泵。LocalJobRunner:未在存档名称中键入信息感谢grtin,我可以使用-input\u compressed选项导入文档。我们还可以进行筛选,以便只导入选定的文档。存档包含图像和PDF以及XML和I wan,仅用于在marklogic数据库中摄取XML。