将大型文件转储到MarkLogic DB的更好方法

将大型文件转储到MarkLogic DB的更好方法,marklogic,marklogic-8,data-dump,marklogic-7,Marklogic,Marklogic 8,Data Dump,Marklogic 7,我是MarkLogic的新手,通过一些转换(如基于某些条件的过滤器等)对其进行评估以转储巨大的csv/文本数据。据我所知,我可以使用两种方式转储数据 1) Using java api for MarkLogic in a multi-threaded environment. 2) MLCP with custom transformation. 我想知道实现这一目标的更好方法是什么?或者如果还有其他的,我不知道 提前感谢。您提到的两种方法都会奏效。其中一个更容易实现,但您可以从另一个获得更

我是MarkLogic的新手,通过一些转换(如基于某些条件的过滤器等)对其进行评估以转储巨大的csv/文本数据。据我所知,我可以使用两种方式转储数据

1) Using java api for MarkLogic in a multi-threaded environment.
2) MLCP with custom transformation.
我想知道实现这一目标的更好方法是什么?或者如果还有其他的,我不知道


提前感谢。

您提到的两种方法都会奏效。其中一个更容易实现,但您可以从另一个获得更好的性能

将MLCP与自定义转换一起使用应该很简单。MLCP已经知道如何使用。使用自定义变换,您将可以。实现非常简单。警告如下:

对于大型数据集,这将对数据加载的速度产生显著影响。如果您不打算在转换中处理URI,请查看
-fastload
选项

如果改用JavaAPI,则需要解析CSV(我确信有一个库),应用所需的转换并进行插入。这是您需要编写的更多代码(如果您要长期这样做的话,可能还需要维护),但是由于您要插入一堆已经转换过的文档,您可以这样做

如果这是一个一次性的过程,我会倾向于MLCP,除非你的内容是海量的(不要让我定义海量)。如果您打算在长期内多次运行此作业,那么在Java层中这样做可能更值得

无论你走哪条路,都可能值得回顾一下指南中的部分