Cassandra Timeseries:压缩不经常更改的字段

Cassandra Timeseries:压缩不经常更改的字段,cassandra,cassandra-2.0,Cassandra,Cassandra 2.0,我需要为每个条目存储带有时间戳的车辆位置、反向地理编码地址和一些简单的数字传感器值 如果我存储备用地址和反向地理编码器返回的其他元数据,反向地理编码地址在100到200字节之间,大约4kb。大多数情况下,地址在连续记录中不会改变。我想知道卡桑德拉是否有可能压缩这种不经常变化的值。类似地,温度、压力等其他传感器值也不会经常变化 几年前,我曾短暂尝试过使用InfoBright的MySQL列存储引擎。它的一个主张是,它能很好地压缩不经常变化的磁场 卡桑德拉能做这样的事吗?我读了一些文章,让我觉得是的。

我需要为每个条目存储带有时间戳的车辆位置、反向地理编码地址和一些简单的数字传感器值

如果我存储备用地址和反向地理编码器返回的其他元数据,反向地理编码地址在100到200字节之间,大约4kb。大多数情况下,地址在连续记录中不会改变。我想知道卡桑德拉是否有可能压缩这种不经常变化的值。类似地,温度、压力等其他传感器值也不会经常变化

几年前,我曾短暂尝试过使用InfoBright的MySQL列存储引擎。它的一个主张是,它能很好地压缩不经常变化的磁场

卡桑德拉能做这样的事吗?我读了一些文章,让我觉得是的。如果是这样的话,这是一个致命的特性,因为大多数涉及传感器的时间序列数据都有很大的行程压缩空间。但是,在我遇到的文章中,人们对这个话题普遍缺乏热情,这让我觉得,在实践中,好处并不多。或者,他们根本没有像我一样有长时间重复数据的数据。报告的压缩比约为4倍。基于一个简单的RLE,我期望至少是10倍。但由于Cassandra的算法比RLE好,我希望能获得更大的压缩比

我正在阅读所有关于卡桑德拉的文章,不久我将亲自做这些测试。但如果有人能分享他们的两分钱那就太好了