Marklogic Nifi中的逻辑处理器

Marklogic Nifi中的逻辑处理器,marklogic,apache-nifi,marklogic-9,Marklogic,Apache Nifi,Marklogic 9,我计划使用Nifi marklogic处理器从我的s3存储桶中摄取文档 下面的putMarklogic是否使用MLCP 它可以接受所有MLCP选项,例如:aggregate\u record\u namespace或transform\u module或transform\u namespace或transform\u param 如果不是,我的选择是什么,是不是在编写自定义处理器时使用MCLP,因为我喜欢MLCP提供的灵活性:) 如您所见,我计划调用我的DHF输入流。。因此,在查看代码之后

我计划使用Nifi marklogic处理器从我的s3存储桶中摄取文档

  • 下面的putMarklogic是否使用MLCP
  • 它可以接受所有MLCP选项,例如:
    aggregate\u record\u namespace
    transform\u module
    transform\u namespace
    transform\u param
  • 如果不是,我的选择是什么,是不是在编写自定义处理器时使用MCLP,因为我喜欢MLCP提供的灵活性:)
如您所见,我计划调用我的DHF输入流。。因此,在查看代码之后,我想我可以将
transform:ml:inputFlow
和其他转换参数设置为前缀
trans:
。。这是正确的吗


如何执行mlcp
聚合
聚合_记录_元素
聚合_记录_命名空间
。。当我加载带有多个xml文件的
.xml.gz
文件时。。或者,我唯一的选择是将它们分解为单个文件

我通过编写一个调用
ContentPump.runCommand
的自定义处理器解决了这个问题。仅供参考,如果有人感兴趣,我必须排除
log4j
并添加
log4j-over-slf4j
,以便mclp可以将进度日志写入
nifi app.log

嗨,拉维,putMarkLogic没有使用MLCP。MLCP工具仅从文件系统读取数据。相反,它使用的是MarkLogic Java客户端API,特别是DataMovementManager。关于如何使用
DataMovementManager实现聚合,如
mlcp
。基本上,我希望将一个巨大的xml转换成多个xml记录,这些记录将作为xml文档存储在ML中。。每个聚合的xml都是多个GIG<代码>mlcp处理此问题。。如何使用
DataMonvementManager