Apache nifi 如何使用ApacheNIFI删除重复文件?

Apache nifi 如何使用ApacheNIFI删除重复文件?,apache-nifi,Apache Nifi,我设置了两台EC2服务器,每个实例上都安装了相同的EFS 还分别在两台机器上安装了ApacheNIFI。现在,当我尝试创建数据流来复制EFS挂载文件夹中的文件时,两台服务器上都会出现重复的文件 ApacheNIFI中是否有某种方法可以让我大量生产出重复的项目,因为它们都是同时启动的。Cron不够有用,因为在某些时候,服务器会同时发生冲突。要检测重复文件,可以使用DetectDuplicate处理器 将nifi实例组织到集群中,这样您就可以只为特定处理器设置当前主节点来接收文件。@daggett我

我设置了两台EC2服务器,每个实例上都安装了相同的EFS

还分别在两台机器上安装了ApacheNIFI。现在,当我尝试创建数据流来复制EFS挂载文件夹中的文件时,两台服务器上都会出现重复的文件


ApacheNIFI中是否有某种方法可以让我大量生产出重复的项目,因为它们都是同时启动的。Cron不够有用,因为在某些时候,服务器会同时发生冲突。

要检测重复文件,可以使用DetectDuplicate处理器


将nifi实例组织到集群中,这样您就可以只为特定处理器设置当前主节点来接收文件。@daggett我想避免单点故障,这就是为什么我不能仅从一个节点接收文件的原因首先-如果节点失败-另一个节点作为主节点。如果没有群集,您必须使用缓存服务器、数据库或其他系统来帮助您删除(防止)重复项。好的,请尝试一下Nifi群集,您知道有什么好的资源可以开始使用群集吗?