Cassandra 卡桑德拉1.2 V节点在生产中的应用

Cassandra 卡桑德拉1.2 V节点在生产中的应用,cassandra,Cassandra,自从Vnodes与Cassandra 1.2一起发布以来,一年过去了。我读过几篇描述此功能的Datastax文章,他们说此功能很棒,但我想问问那些在生产中使用此功能的人: 它真的稳定并且可以生产吗 修复运行时,修复速度和磁盘使用开销如何?对我们来说非常重要 再平衡速度呢 在启用Cassandra vnodes的情况下使用Hadoop时,稳定性/性能如何 什么时候应该避免使用VNode 在RF=3的情况下,每个节点的容量为1.5Tb。当我打开vnodes时,是否所有数据都将被重新分发?我关心的是网

自从Vnodes与Cassandra 1.2一起发布以来,一年过去了。我读过几篇描述此功能的Datastax文章,他们说此功能很棒,但我想问问那些在生产中使用此功能的人:

  • 它真的稳定并且可以生产吗
  • 修复运行时,修复速度和磁盘使用开销如何?对我们来说非常重要
  • 再平衡速度呢
  • 在启用Cassandra vnodes的情况下使用Hadoop时,稳定性/性能如何
  • 什么时候应该避免使用VNode
  • 在RF=3的情况下,每个节点的容量为1.5Tb。当我打开vnodes时,是否所有数据都将被重新分发?我关心的是网络

  • 我不能回答你所有的问题,但以下是我能帮忙的

  • 修复只受VNode的影响很小。假设每个节点有256个令牌,则修复任务的数量是原来的256倍,而每个修复任务的数量要小256倍。对于非常少量的数据以外的任何内容,创建额外任务的额外开销可以忽略不计。因此,我认为您不会注意到使用1.5 TB数据进行修复的任何区别

  • 您不需要重新平衡VNode。添加和删除节点时,集群保持平衡

  • 升级到VNode是最大的挑战。实际上,所有数据都需要重新分发。这可以通过shuffle(在实践中效果不是很好,因此不建议使用shuffle)、停用和引导每个节点(留下一个节点临时存储所有数据的副本)或复制硬件并创建一个新的虚拟数据中心,然后停用旧的虚拟数据中心来实现


  • 这是6个问题。你应该分开邮寄。此外,他们可能会因为主观而被关闭。