Apache kafka 卡夫卡:主题与分区数据

Apache kafka 卡夫卡:主题与分区数据,apache-kafka,partition,kafka-topic,Apache Kafka,Partition,Kafka Topic,通过阅读卡夫卡文档和各种其他资源,我了解到卡夫卡中的信息是按主题组织的。此外,一个主题可以分解为多个分区,每个分区可以托管在不同的服务器上。这提供了冗余和可伸缩性 我不知道“破碎”这个词在这里是什么意思。这是否意味着,如果添加到主题的消息是,比如说“1234567”,那么在将其划分为多个分区之后,我们将有一个分区,其中只有整个主题的一个子部分。就像一个分区有'1 2 3',而另一个分区有'4 5 6',而另一个分区只有'7'。或者它是否意味着每个分区都有“1234567”,这意味着我们有精确的副

通过阅读卡夫卡文档和各种其他资源,我了解到卡夫卡中的信息是按主题组织的。此外,一个主题可以分解为多个分区,每个分区可以托管在不同的服务器上。这提供了冗余和可伸缩性

我不知道“破碎”这个词在这里是什么意思。这是否意味着,如果添加到主题的消息是,比如说“1234567”,那么在将其划分为多个分区之后,我们将有一个分区,其中只有整个主题的一个子部分。就像一个分区有'1 2 3',而另一个分区有'4 5 6',而另一个分区只有'7'。或者它是否意味着每个分区都有“1234567”,这意味着我们有精确的副本

一个主题可以分解为多个分区,每个分区可以托管在不同的服务器上。这提供了冗余和可伸缩性

上面的语句是指-卡夫卡主题通常被划分为若干个分区。分区允许通过在不同的代理之间分割数据来并行化主题。如果一个主题只包含一个分区,则数据驻留在单个代理上,并将按顺序读取。假设分区数为3,则相同的数据将被拆分为3个分区,每个分区承载不同的事件集。您可以在3个并行进程中读取主题,每个进程从一个分区读取。分区的数量越多,可实现的可伸缩性就越强。 是的,每个分区将只有数据的子集