Apache nifi 如何在nifi工作流中仅获取两个日期之间的HDFS文件数据?

Apache nifi 如何在nifi工作流中仅获取两个日期之间的HDFS文件数据?,apache-nifi,Apache Nifi,我有一些文件存储在HDFS服务器中。现在我只想获取一周的文件。同时,在获取数据时,我必须制作一个正则表达式,其中我只需要获取一周的数据。 示例:我们在服务器上有数据,例如 dt=2019-12-25 dt=2019-12-26 dt=2019-12-27 dt=2019-12-28 dt=2019-12-29 dt=2019-12-30 dt=2019-12-31 我必须删除其余的数据。要获得一周前的文件,可以使用ListHDFS/GetHDFS处理器的Maximum File Age属性将值

我有一些文件存储在HDFS服务器中。现在我只想获取一周的文件。同时,在获取数据时,我必须制作一个正则表达式,其中我只需要获取一周的数据。 示例:我们在服务器上有数据,例如

dt=2019-12-25
dt=2019-12-26
dt=2019-12-27
dt=2019-12-28
dt=2019-12-29
dt=2019-12-30
dt=2019-12-31

我必须删除其余的数据。

要获得一周前的文件,可以使用
ListHDFS/GetHDFS
处理器的
Maximum File Age
属性将值设置为7天。但此属性不支持Nifi expression language。自动化解决方法-使用
ListHDFS
获取所有文件后,尝试使用
hdfs.lastModified
属性,然后使用
UpdateAttribute
派生天数,并使用
RouteOnAttribute
路由所需文件。因此,流应该类似于
ListHDFS=>UpdateAttribute(计算天数)=>RouteOnAttribute
参考此-