Apache kafka Flume agent在连续发送数据时生成多个.tmp文件

Apache kafka Flume agent在连续发送数据时生成多个.tmp文件,apache-kafka,cloudera,flume,Apache Kafka,Cloudera,Flume,我有一个flume代理在CDH 5.8.3中运行。如果发送的有效文件超过3个,则在写入hdfs时会创建多个.tmp文件。在hdfs接收器之前,有一个拦截器将有效的XML路由到适当的主题。该代理正在使用flafka。拦截器和卡夫卡工作正常 agent.sinks.hdfs_valid.channel=valid_channel agent.sinks.hdfs_valid.type=hdfs agent.sinks.hdfs_valid.writeFormat=Text agent.sinks.h

我有一个flume代理在CDH 5.8.3中运行。如果发送的有效文件超过3个,则在写入hdfs时会创建多个.tmp文件。在hdfs接收器之前,有一个拦截器将有效的XML路由到适当的主题。该代理正在使用flafka。拦截器和卡夫卡工作正常

agent.sinks.hdfs_valid.channel=valid_channel
agent.sinks.hdfs_valid.type=hdfs
agent.sinks.hdfs_valid.writeFormat=Text
agent.sinks.hdfs_valid.hdfs.fileType=DataStream
agent.sinks.hdfs_valid.hdfs.filePrefix=event
agent.sinks.hdfs_valid.hdfs.fileSuffix=.xml
agent.sinks.hdfs_valid.hdfs.path=locationoffile/%{time}
agent.sinks.hdfs_valid.hdfs.idleTimeout=900
agent.sinks.hdfs_valid.hdfs.rollInterval=3600
agent.sinks.hdfs_valid.hdfs.kerberosPrincipal=authentication@example.com
agent.sinks.hdfs_valid.hdfs.kerberosKeytab=locationofkeytab
agent.sinks.hdfs_valid.hdfs.rollSize=0
agent.sinks.hdfs_valid.hdfs.rollCount=0
agent.sinks.hdfs_valid.hdfs.callTimeout=100000

好吧,很有趣。我们的卡夫卡分区设置为20。当水槽从中消耗时。前10个分区使用一个ip,它打开一个.tmp。第二个10个分区正在使用另一个ip,它会打开第二个.tmp。这似乎是水槽的内部功能。尽管打开了两个.tmp,但所有数据都正确到达