获取行上的Hbase协处理器聚合_Hbase_Aggregation

获取行上的Hbase协处理器聚合

hbase

获取行上的Hbase协处理器聚合,hbase,aggregation,Hbase,Aggregation,我们有一个用例，其中我们需要将大量销售数据导入Hadoop。然后用户群将使用这些数据。用户将做进一步的聚合&可能做sum、avg、count等需要让查询快速返回结果。因此，我们正在探索hbase而不仅仅是hive。下面是示例数据日期商店发票项目销售费用 1-1月1日10031231243 24 一月二日至三日101 344324 434 232 一月三日至二日102 342344 34 23 我知道，使用Hbase协处理器端点，聚合可以避免mapreduce作业，并且延迟较低。但当用户仅获取

我们有一个用例，其中我们需要将大量销售数据导入Hadoop。然后用户群将使用这些数据。用户将做进一步的聚合&可能做sum、avg、count等

需要让查询快速返回结果。因此，我们正在探索hbase而不仅仅是hive。下面是示例数据

日期商店发票项目销售费用 1-1月1日10031231243 24 一月二日至三日101 344324 434 232 一月三日至二日102 342344 34 23

我知道，使用Hbase协处理器端点，聚合可以避免mapreduce作业，并且延迟较低。但当用户仅获取行的子集时，不确定如何实现它。
假设在上述情况下，用户希望看到第1项和第2项的销售额之和，那么结果应该是77，query应该在最长几秒钟内返回结果。其他用户可能希望查看项目2和3的销售情况。谢谢你的建议