Database 柱状数据库—可以查询(聚合)压缩数据的数据库

Database 柱状数据库—可以查询(聚合)压缩数据的数据库,database,nosql,hbase,amazon-redshift,Database,Nosql,Hbase,Amazon Redshift,我想运行聚合查询(例如,在列/colfam中,值“1”对某些行键重复多少次)。我想在压缩数据上运行这些查询,因为它们将提供更好的性能,我们可以完全跳过解压缩 我目前正在使用HBASE的聚合客户端,它看起来像(尚未检查源代码…可能是错误的)HBASE使用其b树索引查找行键,解压缩该块并按顺序读取数据。是否有方法跳过解压缩过程 看起来红移(ParAccel)也在以同样的方式进行聚合 如何通过仅处理压缩数据使HBase计算计数。如果不可能,是否有其他列数据库提供此功能。红移使用“区域映射”以避免不必要

我想运行聚合查询(例如,在列/colfam中,值“1”对某些行键重复多少次)。我想在压缩数据上运行这些查询,因为它们将提供更好的性能,我们可以完全跳过解压缩

我目前正在使用HBASE的聚合客户端,它看起来像(尚未检查源代码…可能是错误的)HBASE使用其b树索引查找行键,解压缩该块并按顺序读取数据。是否有方法跳过解压缩过程

看起来红移(ParAccel)也在以同样的方式进行聚合

如何通过仅处理压缩数据使HBase计算计数。如果不可能,是否有其他列数据库提供此功能。

红移使用“区域映射”以避免不必要的解压缩。每个压缩1MB“块”都存储每列的最小/最大/计数(加上其他一些)

每个块的内容由排序键定义。如果您的查询与排序键对齐(并且可以从区域映射中得到回答),则红移不会不必要地解压缩数据

以上所有内容都可以避免阅读文档和广泛使用.YMMV