Apache kafka Kafka和Kafka Connect部署环境

Apache kafka Kafka和Kafka Connect部署环境,apache-kafka,apache-kafka-connect,Apache Kafka,Apache Kafka Connect,如果我已经让Kafka在本地运行,那么Kafka Connect只是我现有Kafka上的一个配置,还是Kafka Connect需要它自己的服务器/环境与我现有Kafka的服务器/环境分开?Kafka Connect是它自己在引导服务器配置上的配置 对于Kafka Connect,您可以在独立服务器或分布式连接服务器之间进行选择,并且必须更新相应的属性文件以指向当前运行的Kafka服务器 在{kafka root}/config下查看,您将看到 基本上,您将根据需要更新connect stan

如果我已经让Kafka在本地运行,那么Kafka Connect只是我现有Kafka上的一个配置,还是Kafka Connect需要它自己的服务器/环境与我现有Kafka的服务器/环境分开?

Kafka Connect是它自己在
引导服务器
配置上的配置

对于Kafka Connect,您可以在独立服务器或分布式连接服务器之间进行选择,并且必须更新相应的属性文件以指向当前运行的Kafka服务器

{kafka root}/config
下查看,您将看到


基本上,您将根据需要更新connect standalone或connect distributed属性。

Kafka connect是Apache Kafka的一部分,但它作为一个单独的进程运行,称为Kafka connect Worker。除了在沙箱环境中,您通常会将其部署在Kafka代理的单独机器/节点上

此图从概念上显示了它是如何运行的,与您的代理不同:

您可以在单个节点上运行Kafka Connect,也可以作为集群的一部分运行(以实现吞吐量和冗余)


您可以在这里阅读更多关于和的内容。

我很困惑,因为您说这只是引导服务器上的配置,但您还提到了连接服务器和有关连接群集的文档。我编辑了我的回答,以使其更清楚。您可以在独立模式或分布式(群集)模式下运行kafka connect,具体取决于您使用connect处理的数据量。因此,我的说法是正确的:您需要为connect提供单独的服务器,并且这些服务器已配置为与现有kafka服务器一起工作。但底线是Connect需要它自己的服务器,而且它不仅仅是添加到现有kafka服务器的配置文件。是的,这听起来是正确的。您将Connect作为一个新进程启动,在自己的服务器上启动它可能是一个好主意。但是,您可以在引导Kafka服务器运行的同一服务器上运行此进程,具体取决于连接进程将使用的资源。希望这有帮助。干杯。谢谢罗宾,我看不到那张图。你能试着重新链接它吗?它在imgur.com上:-你是在一个可能会阻止它的代理后面吗?