cassandra中的分区大小到底是多少?

cassandra中的分区大小到底是多少?,cassandra,cassandra-3.0,Cassandra,Cassandra 3.0,我是Cassandra的新手,我有一个有6个节点的Cassandra集群。我正试图找到分区大小 尝试使用此基本命令获取它 nodetool表直方图keyspace.tablename 现在,我想知道它是如何计算的,为什么结果只有5条记录,而节点数是6,而不是min,max。一个表的节点大小和分区数有关系吗 基本上,我所知道的是分区键用于散列和分发要在各个节点上持久化的数据 我们到底什么时候去打球?我假设Cassandra有一个分区器,负责跨节点的分布式持久性。此列中的条目数与节点数无关。它显示

我是Cassandra的新手,我有一个有6个节点的Cassandra集群。我正试图找到分区大小

尝试使用此基本命令获取它

nodetool表直方图keyspace.tablename

现在,我想知道它是如何计算的,为什么结果只有5条记录,而节点数是6,而不是min,max。一个表的节点大小和分区数有关系吗

基本上,我所知道的是分区键用于散列和分发要在各个节点上持久化的数据


我们到底什么时候去打球?我假设Cassandra有一个分区器,负责跨节点的分布式持久性。

此列中的条目数与节点数无关。它显示了值的分布-您有最小值、最大值和(50/75/95/98/99)

大多数
nodetool
命令不显示任何有关其他节点的信息-它们只是提供有关当前节点的信息的工具


另外,这将有助于解释如何解释此信息。

此列中的条目数与节点数无关。它显示了值的分布-您有最小值、最大值和(50/75/95/98/99)

大多数
nodetool
命令不显示任何有关其他节点的信息-它们只是提供有关当前节点的信息的工具


另外,这将有助于解释如何解释此信息。

正如命令的名称所示,
tablehistograms
报告节点所持有分区的元数据分布

为了补充Alex Ott已经说过的内容,百分比(而不是百分比)提供了元数据值范围的洞察力。例如:

  • 给定表的50%分区的大小不超过74KB
  • 95%是263KB或更少
  • 98%为455KB或以下
这些元数据与集群中的分区数或节点数没有任何关联

分区键被散列,结果值确定分区(及其相关行)的存储位置(分布在集群中的节点之间),这是正确的。如果你感兴趣的话,我已经在这篇文章中用一些例子详细解释了--

就bucketing而言,您通常会这样做以减少分区中的行数,从而减小分区的大小。一般的建议是将分区大小保持在100MB以下,以获得最佳性能,但这不是一条硬性规定——只要您知道折衷,就可以使用更大的分区


在您的例子中,larges分区只有455KB,所以大小不成问题。干杯

正如命令名所示,
tablehistograms
报告节点所持有分区的元数据分布

为了补充Alex Ott已经说过的内容,百分比(而不是百分比)提供了元数据值范围的洞察力。例如:

  • 给定表的50%分区的大小不超过74KB
  • 95%是263KB或更少
  • 98%为455KB或以下
这些元数据与集群中的分区数或节点数没有任何关联

分区键被散列,结果值确定分区(及其相关行)的存储位置(分布在集群中的节点之间),这是正确的。如果你感兴趣的话,我已经在这篇文章中用一些例子详细解释了--

就bucketing而言,您通常会这样做以减少分区中的行数,从而减小分区的大小。一般的建议是将分区大小保持在100MB以下,以获得最佳性能,但这不是一条硬性规定——只要您知道折衷,就可以使用更大的分区

在您的例子中,larges分区只有455KB,所以大小不成问题。干杯