Apache kafka 卡夫卡2.0-卡夫卡连接接收器-创建卡夫卡制作人_Apache Kafka_Apache Kafka Connect_Google Cloud Pubsub

Apache kafka 卡夫卡2.0-卡夫卡连接接收器-创建卡夫卡制作人

apache-kafka

Apache kafka 卡夫卡2.0-卡夫卡连接接收器-创建卡夫卡制作人,apache-kafka,apache-kafka-connect,google-cloud-pubsub,Apache Kafka,Apache Kafka Connect,Google Cloud Pubsub,我们目前使用的是HDF（Hortonworks数据流）3.3.1，它捆绑了Kafka 2.0.0，并试图在分布式模式下使用Kafka Connect来启动Google Cloud PubSub-Sink连接器。我们计划将一些元数据发送回Kafka主题，并需要将Kafka生产者集成到Sink任务java代码的flush（）函数中这会不会对Kafka Connect将偏移提交回Kafka的过程产生负面影响（因为我们会在刷新之前增加运行Kafka生产者的开销）。另外，当接收器或源的连接器属性中未

我们目前使用的是HDF（Hortonworks数据流）3.3.1，它捆绑了Kafka 2.0.0，并试图在分布式模式下使用Kafka Connect来启动Google Cloud PubSub-Sink连接器。我们计划将一些元数据发送回Kafka主题，并需要将Kafka生产者集成到Sink任务java代码的flush（）函数中

这会不会对Kafka Connect将偏移提交回Kafka的过程产生负面影响（因为我们会在刷新之前增加运行Kafka生产者的开销）。

另外，当接收器或源的连接器属性中未指定引导服务器列表时，Kafka Connect如何从配置中获取引导服务器列表？我需要使用相同的引导服务器列表来启动生产者。目前，我正在更改接收器连接器的配置，将引导服务器列表添加为属性，并在连接器的Java代码中对其进行解析。如果可能的话，我想使用Kafka Connect worker属性中的引导服务器列表

请帮忙

提前谢谢

需要将Kafka生产者集成到Sink任务java代码的flush（）函数中

SinkTask API中没有公开的生产者实例

这会不会对Kafka Connect将偏移提交回Kafka的过程产生负面影响（因为我们会在刷新之前增加运行Kafka生产者的开销）

我的意思是，你可以添加任何你想要的代码。就负面影响而言，这取决于您对自己的基础设施进行基准测试。显然，添加更多的阻塞代码会使其他进程总体上变慢

当接收器或源的连接器属性中未指定引导服务器列表时，Kafka Connect如何从配置中获取引导服务器列表

汇和源不是工人。查看

connectdistributed.properties

如果可能的话，我想使用Kafka Connect worker属性中的引导服务器列表

这是不可能的。向接收器/源配置添加额外属性是唯一的方法。（尽管如此，您可以随意制作一个Kafka JIRA，请求提供公开worker配置的功能）