获取行上的Hbase协处理器聚合

获取行上的Hbase协处理器聚合,hbase,aggregation,Hbase,Aggregation,我们有一个用例,其中我们需要将大量销售数据导入Hadoop。然后用户群将使用这些数据。用户将做进一步的聚合&可能做sum、avg、count等 需要让查询快速返回结果。因此,我们正在探索hbase而不仅仅是hive。下面是示例数据 日期商店发票项目销售费用 1-1月1日10031231243 24 一月二日至三日101 344324 434 232 一月三日至二日102 342344 34 23 我知道,使用Hbase协处理器端点,聚合可以避免mapreduce作业,并且延迟较低。但当用户仅获取

我们有一个用例,其中我们需要将大量销售数据导入Hadoop。然后用户群将使用这些数据。用户将做进一步的聚合&可能做sum、avg、count等

需要让查询快速返回结果。因此,我们正在探索hbase而不仅仅是hive。下面是示例数据

日期商店发票项目销售费用 1-1月1日10031231243 24 一月二日至三日101 344324 434 232 一月三日至二日102 342344 34 23

我知道,使用Hbase协处理器端点,聚合可以避免mapreduce作业,并且延迟较低。但当用户仅获取行的子集时,不确定如何实现它。
假设在上述情况下,用户希望看到第1项和第2项的销售额之和,那么结果应该是77,query应该在最长几秒钟内返回结果。 其他用户可能希望查看项目2和3的销售情况。谢谢你的建议