Regex 使用flume拦截器逐行过滤文件
我正在尝试配置从.csv或.xl3读取的flume代理。文件的一个示例:Regex 使用flume拦截器逐行过滤文件,regex,hadoop,hadoop2,flume,flume-ng,Regex,Hadoop,Hadoop2,Flume,Flume Ng,我正在尝试配置从.csv或.xl3读取的flume代理。文件的一个示例: ClientA ClientB Start-time End-time Duration Status 35862515 36958452 16/01/2017 16/01/2017 10 good 32456988 22583694 16/01/2017 16/01/2017 05 good 35968478 36985724 16/01/2017 16/
ClientA ClientB Start-time End-time Duration Status
35862515 36958452 16/01/2017 16/01/2017 10 good
32456988 22583694 16/01/2017 16/01/2017 05 good
35968478 36985724 16/01/2017 16/01/2017
32456988 22583694 16/01/2017 16/01/2017 01 good
我要代理逐行筛选文件。如果持续时间不为null,则事件将发送到hdfs/usr/admin/Good_调用,否则,事件将发送到另一个path/usr/admin/Bad_调用
如何使用flume配置实现这一点,拦截器可以使用和。作为正则表达式提取器的结果,“好”行和“坏”行将有不同的标题。最后,添加将根据标头的值决定发送事件的位置。您可以使用和。作为正则表达式提取器的结果,“好”行和“坏”行将有不同的标题。最后,添加将根据头的值决定将事件发送到何处