Apache nifi GetFile处理器在ApacheNIFI中持续运行

Apache nifi GetFile处理器在ApacheNIFI中持续运行,apache-nifi,Apache Nifi,我正在使用ApacheNIFI将一些本地文件复制到HDFS。 我已经创建了一个绑定到PutHDFS处理器的GetFile处理器。GetFile处理器递归地查询一个只读的目录。我遇到的问题是,文件不断被复制,例如,如果我删除HDFS上复制的文件,那么它们很快就会重新出现 在GetFile处理器配置中,我将Keep Source File设置为true,因为该目录是只读的,并且在只读目录中的目录中指定,如果该参数设置为false,则忽略这些文件: 如果为true,则文件复制到数据库后不会被删除 内容

我正在使用ApacheNIFI将一些本地文件复制到HDFS。 我已经创建了一个绑定到
PutHDFS
处理器的
GetFile
处理器。
GetFile
处理器递归地查询一个只读的目录。我遇到的问题是,文件不断被复制,例如,如果我删除HDFS上复制的文件,那么它们很快就会重新出现

GetFile
处理器配置中,我将
Keep Source File
设置为true,因为该目录是只读的,并且在只读目录中的目录中指定,如果该参数设置为false,则忽略这些文件:

如果为true,则文件复制到数据库后不会被删除 内容存储库;这会导致不断拾取文件 并且对于测试目的非常有用。如果不保留原版,NiFi将 需要对从中提取的目录具有写入权限,否则 它将忽略该文件


是否可以只复制每个文件一次?

您可以使用和处理器来执行此操作。ListFile将跟踪到目前为止看到的文件,并且不会继续列出这些文件,除非它们已被修改。请确保将FetchFile中的完成策略设置为“无”,以确保没有人试图移动/删除该文件。

谢谢,它成功了。是否有方法重置处理器,使其忘记已导入的文件?是的,停止ListFile处理器,然后右键单击并选择“查看状态”。在“状态”对话框中有一个指向“清除状态”的链接。