将大型文件转储到MarkLogic DB的更好方法_Marklogic_Marklogic 8_Data Dump_Marklogic 7

将大型文件转储到MarkLogic DB的更好方法

marklogic

将大型文件转储到MarkLogic DB的更好方法,marklogic,marklogic-8,data-dump,marklogic-7,Marklogic,Marklogic 8,Data Dump,Marklogic 7,我是MarkLogic的新手，通过一些转换（如基于某些条件的过滤器等）对其进行评估以转储巨大的csv/文本数据。据我所知，我可以使用两种方式转储数据 1) Using java api for MarkLogic in a multi-threaded environment. 2) MLCP with custom transformation. 我想知道实现这一目标的更好方法是什么？或者如果还有其他的，我不知道提前感谢。您提到的两种方法都会奏效。其中一个更容易实现，但您可以从另一个获得更

我是MarkLogic的新手，通过一些转换（如基于某些条件的过滤器等）对其进行评估以转储巨大的csv/文本数据。据我所知，我可以使用两种方式转储数据

1) Using java api for MarkLogic in a multi-threaded environment.
2) MLCP with custom transformation.

我想知道实现这一目标的更好方法是什么？或者如果还有其他的，我不知道

提前感谢。

您提到的两种方法都会奏效。其中一个更容易实现，但您可以从另一个获得更好的性能

将MLCP与自定义转换一起使用应该很简单。MLCP已经知道如何使用。使用自定义变换，您将可以。实现非常简单。警告如下：

对于大型数据集，这将对数据加载的速度产生显著影响。如果您不打算在转换中处理URI，请查看

-fastload

选项

如果改用JavaAPI，则需要解析CSV（我确信有一个库），应用所需的转换并进行插入。这是您需要编写的更多代码（如果您要长期这样做的话，可能还需要维护），但是由于您要插入一堆已经转换过的文档，您可以这样做

如果这是一个一次性的过程，我会倾向于MLCP，除非你的内容是海量的（不要让我定义海量）。如果您打算在长期内多次运行此作业，那么在Java层中这样做可能更值得

无论你走哪条路，都可能值得回顾一下指南中的部分