高效的Cassandra键空间设计
我有一个关于最佳Cassandra数据库设计的问题:拥有一个包含大量细行的表是有效的还是拥有一个包含许多表的键空间是有效的 背景: 我正在尝试存储来自多个传感器的数据。一种方法是使用一个表来存储来自所有传感器的数据。另一种方法是每个传感器有一个表。哪一个更好高效的Cassandra键空间设计,cassandra,Cassandra,我有一个关于最佳Cassandra数据库设计的问题:拥有一个包含大量细行的表是有效的还是拥有一个包含许多表的键空间是有效的 背景: 我正在尝试存储来自多个传感器的数据。一种方法是使用一个表来存储来自所有传感器的数据。另一种方法是每个传感器有一个表。哪一个更好 请告知。为所有传感器提供一个表是更好的习惯做法。每个表都会引入一些开销(用于度量、文件等的MXBean),所以您不需要太多 当你说“大量的瘦行”时,我并不认为这是一个问题,你可以有许多唯一的键/分区(一些非常大的数字)。我会选择较少的表,原
请告知。为所有传感器提供一个表是更好的习惯做法。每个表都会引入一些开销(用于度量、文件等的MXBean),所以您不需要太多
当你说“大量的瘦行”时,我并不认为这是一个问题,你可以有许多唯一的键/分区(一些非常大的数字)。我会选择较少的表,原因有很多:
我认为“疯狂大数”是2^127或170141183460469231731687303715884105728,听起来不错(而且疯狂大!),这是来自分区器的唯一哈希数吗?我认为对于Murruit3,它使用了散列的前半部分,所以我认为它是2^63(我可能错了)。是的,我认为2^127来自随机分割者时代。我认为你是对的,杂音3有点像-2^63到+2^63;也就是2^63*2。与2^127不太一样,但仍然非常大!英雄联盟