Apache nifi NiFi处理器计划程序仅为一个文件运行

Apache nifi NiFi处理器计划程序仅为一个文件运行,apache-nifi,Apache Nifi,NiFi版本1.5 我有一个需求,正在探索调度程序。刚刚注意到,调度程序只处理一个文件,而不考虑文件的存在。比如说, GenerateFlowFile->UpdateAttribute->LogAttribute GenerateFlowFile每10秒运行一次。 UpdateAttribute已计划0/1*1/1*?*每1分钟 我注意到,GenerateFlowFile生成了6个文件。UpdateAttribute只处理6个文件中的一个文件 这里,我希望UpdateAttribute每1分钟运

NiFi版本1.5 我有一个需求,正在探索调度程序。刚刚注意到,调度程序只处理一个文件,而不考虑文件的存在。比如说,

GenerateFlowFile->UpdateAttribute->LogAttribute

GenerateFlowFile每10秒运行一次。 UpdateAttribute已计划0/1*1/1*?*每1分钟

我注意到,GenerateFlowFile生成了6个文件。UpdateAttribute只处理6个文件中的一个文件


这里,我希望UpdateAttribute每1分钟运行一次队列中的所有文件。

在这种情况下,您通常只在源处理器(GenerateFlowFile)上设置特定的计划。在此之后的所有处理器的运行计划应为0秒,这意味着当数据位于前一个队列中时,应尽可能快地运行,否则不要运行。

concurrency to 6您的意思是设置并发任务。但在实时情况下,我不知道有多少文件将到达预定的处理器。然后再增加它。我不明白你想要这些设置做什么。这将取决于目的。在实时情况下,我将获得许多zip文件。解压后的文件,将有5个文件在每个压缩。我应该在putFTP服务器位置每1小时放置一次。理想情况下,我将把解压的文件排到FTP处理器。每小时,putFTP都应该运行,并将所有排队的文件放在服务器位置。在putFTP中,有一个参数
批大小
,我认为您需要设置。