Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/apache-kafka/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache kafka Kafka流式处理线程和正在处理的记录计数_Apache Kafka_Kafka Consumer Api_Apache Kafka Streams_Confluent Platform - Fatal编程技术网

Apache kafka Kafka流式处理线程和正在处理的记录计数

Apache kafka Kafka流式处理线程和正在处理的记录计数,apache-kafka,kafka-consumer-api,apache-kafka-streams,confluent-platform,Apache Kafka,Kafka Consumer Api,Apache Kafka Streams,Confluent Platform,假设我们有一个具有2个分区的主题,并且没有“n”个生产者正在为该主题生成数据。现在,数百万条MessageRecords分布在两个分区上 比如说,我们有两个线程(即两个独立的实例)为Streams处理器供电。现在,在这个设置中,假设线程1(即流式任务1)得到了分区P-1,假设线程2(即流式任务2)得到了分区P-2进行处理 问题是:-比如说,我们想知道,到目前为止,Streaming-Task-1已经处理了多少MessageRecords,或者说是9月28日,2KK??我该怎么做 而且,更大的问题

假设我们有一个具有2个分区的主题,并且没有“n”个生产者正在为该主题生成数据。现在,数百万条MessageRecords分布在两个分区上

比如说,我们有两个线程(即两个独立的实例)为Streams处理器供电。现在,在这个设置中,假设线程1(即流式任务1)得到了分区P-1,假设线程2(即流式任务2)得到了分区P-2进行处理

问题是:-比如说,我们想知道,到目前为止,Streaming-Task-1已经处理了多少
MessageRecords
,或者说是9月28日,2KK??我该怎么做

而且,更大的问题是:“Streaming-Task-1”永远不会知道正在处理的
MessageRecords
的总数,它应该只知道自己处理的总数


它能知道另一个任务处理的计数吗?2有几种方法可以完成你的要求。如果您正在使用DSL,我建议您看看单词计数示例()。通过映射操作,您可以相对简单地进行所需的所有计数


如果您不使用dsl,您仍然可以使用两个处理器和状态存储来执行相同的操作。

谢谢您的回复。我浏览了突出显示的链接,我有一个疑问。这样,每个流处理任务将只计算该任务处理的记录数。我想知道记录的总数!!因为创建的KTable仅在该流任务的本地。正确的??如何解决这个问题!!全球计数很难。您可以采用两步方法:进行局部计数,然后将两个部分计数的结果写入一个分区主题,并将计数相加。