如何使用内容泵导入MarkLogic一个文件多个文档

如何使用内容泵导入MarkLogic一个文件多个文档,marklogic,mlcp,Marklogic,Mlcp,我有一个格式正确的json文件,它是一个文档数组(大约60000个)。我可以使用节点api导入它,但不知道如何使用Marklogic内容泵(windows)导入此文件 我尝试使用基本选项,它只创建了一个名为orders.json的文档。对于MLCP,格式正确的json聚合(称为行分隔json)文件不是对象数组。它是一个文件,每行有一个字符串化对象。考虑CSV,而不是JSON 想象一下,如果您传递了一个数组,MLCP进程将不得不将整个文件解析为一个JSON数组来处理。每行一个对象意味着MLCP可以

我有一个格式正确的json文件,它是一个文档数组(大约60000个)。我可以使用节点api导入它,但不知道如何使用Marklogic内容泵(windows)导入此文件


我尝试使用基本选项,它只创建了一个名为orders.json的文档。对于MLCP,格式正确的json聚合(称为行分隔json)文件不是对象数组。它是一个文件,每行有一个字符串化对象。考虑CSV,而不是JSON

想象一下,如果您传递了一个数组,MLCP进程将不得不将整个文件解析为一个JSON数组来处理。每行一个对象意味着MLCP可以轻松地分割文件并并行处理。事实上,我认为如果使用自动URI,它甚至不会解析为JSON

坏的:

好:

有关这方面的所有好处都可以在这里找到:

相关章节为: (文件版本准确:“9.0-3,2017年9月”)

  • 4.10
  • 4.10.1
[
  {
    "bar": "baz"
  },
  {
    "bar": "buz"
  }
]
{"bar":"baz"}
{"bar":"buz"}