Apache kafka NiFi:从卡夫卡消费时过滤主题

Apache kafka NiFi:从卡夫卡消费时过滤主题,apache-kafka,apache-nifi,Apache Kafka,Apache Nifi,卡夫卡中有一个批处理主题(Jsoncontent),必须通过NiFi(1.8版)使用。 我可以使用consumerkafkareRecord处理器使用此主题,但希望根据属性值进行筛选 因为我不需要那个主题的所有记录 在使用卡夫卡主题时,甚至在将记录输入NiFi之前,是否可以进行筛选?对于这类问题,最好的方法是什么,如使用什么处理器或脚本 我只想根据其中一个属性值过滤掉大量记录,因为它们是不需要的。我知道没有一种方法可以过滤ConsumerKafCareCord中的记录,但在使用该处理器之后,您就

卡夫卡中有一个批处理主题(
Json
content),必须通过
NiFi(1.8版)
使用。 我可以使用
consumerkafkareRecord
处理器使用此主题,但希望根据属性值进行筛选 因为我不需要那个主题的所有记录

在使用卡夫卡主题
时,甚至在将记录输入NiFi
之前,是否可以进行筛选?对于这类问题,最好的方法是什么,如使用什么
处理器
脚本


我只想根据其中一个属性值过滤掉大量记录,因为它们是不需要的。

我知道没有一种方法可以过滤ConsumerKafCareCord中的记录,但在使用该处理器之后,您就可以很容易地做到这一点

一种选择是将其连接到QueryRecord处理器,并编写一条SQL语句来选择您感兴趣的记录


第二个选项是使用PartitionRecord,它允许您根据记录路径表达式对记录进行分区。所以你可以说field1上的分区,如果有两个值,比如A和B,那么它将生成两个流文件,一个包含所有记录和一个包含所有记录和B,然后你只需路由你感兴趣的一个,并将另一个发送到死胡同。

当你说“属性”时你是指每条记录中的字段值(json)?是的,布莱恩!谢谢你,布莱恩。对于选项1,我将如何编写SQL语句来检索嵌套的json属性。你能指出一些例子吗?看看processor文档中的addition details链接,这里有一个分层数据的例子-