在hbase中添加多个列键和值筛选器
我对hbase非常陌生。我们需要获取表的某些数据。下面是示例数据集。我被困在创建过滤器,这对我来说似乎有点复杂。在查询中,我将得到value1,我需要将其与id1cq的值进行比较,另一个值,比如value2,我需要将其与id2cq的值进行比较。在这之后,有多个jj_列的条目,这里我需要首先获取所有以jj_开头的列的最新时间,然后将value3与最新jj_CQ的值进行比较。在sql中,我可以创建类似select*的查询。。其中ID1=''和ID2=''以及ID3=''。如何在Hbase中实现同样的效果。任何帮助都将受到高度赞赏在hbase中添加多个列键和值筛选器,hbase,Hbase,我对hbase非常陌生。我们需要获取表的某些数据。下面是示例数据集。我被困在创建过滤器,这对我来说似乎有点复杂。在查询中,我将得到value1,我需要将其与id1cq的值进行比较,另一个值,比如value2,我需要将其与id2cq的值进行比较。在这之后,有多个jj_列的条目,这里我需要首先获取所有以jj_开头的列的最新时间,然后将value3与最新jj_CQ的值进行比较。在sql中,我可以创建类似select*的查询。。其中ID1=''和ID2=''以及ID3=''。如何在Hbase中实现同样的
ROW COLUMN+CELL
1 column=d:ID1, timestamp=1496273604085, value=5678
1 column=d:ID2, timestamp=1496273604085, value=Jan
1 column=d:data, timestamp=1496273604085, value=TestData1
1 column=d:jj_01/01/2017 01:37:56 AM, timestamp=1496273604085, value=11345601/01/2017 01:37:56 AM
2 column=d:ID1, timestamp=1496273604105, value=5678
2 column=d:ID2, timestamp=1496273604105, value=Jan
2 column=d:data, timestamp=1496273604105, value=TestData2
2 column=d:jj_01/02/2017 10:37:56 AM, timestamp=1496273604105, value=11345601/02/2017 10:37:56 AM
2 column=d:jj_01/02/2017 11:37:56 PM, timestamp=1496273604105, value=11345601/02/2017 11:37:56 PM
3 column=d:ID1, timestamp=1496273604112, value=5678
3 column=d:ID2, timestamp=1496273604112, value=Jan,Feb
3 column=d:data, timestamp=1496273604112, value=TestData3
3 column=d:jj_02/01/2017 11:37:56 AM, timestamp=1496273604112, value=11345602/01/2017 11:37:56 AM
4 column=d:ID1, timestamp=1496273604124, value=5678,1234
4 column=d:ID2, timestamp=1496273604124, value=Jan,Dec
4 column=d:data, timestamp=1496273604124, value=TestData4
4 column=d:jj_02/02/2017 09:37:56 PM, timestamp=1496273604124, value=11345602/02/2017 09:37:56 PM
4 column=d:jj_02/02/2017 11:37:56 AM, timestamp=1496273604124, value=11345602/02/2017 11:37:56 AM
5 column=d:ID1, timestamp=1496273604133, value=5678,1234
5 column=d:ID2, timestamp=1496273604133, value=Jan
5 column=d:data, timestamp=1496273604133, value=TestData5
5 column=d:jj_01/05/2017 11:37:56 AM, timestamp=1496273604133, value=11345601/05/2017 11:37:56 AM
5 column=d:jj_01/06/2017 09:37:56 PM, timestamp=1496273604133, value=11345601/06/2017 09:37:56 PM
6 column=d:ID1, timestamp=1496273604138, value=5678
6 column=d:ID2, timestamp=1496273604138, value=Dec
6 column=d:data, timestamp=1496273604138, value=TestData6
6 column=d:jj_02/02/2017 09:37:56 AM, timestamp=1496273604138, value=11345602/02/2017 09:37:56 AM
7 column=d:ID1, timestamp=1496273604148, value=5678
7 column=d:ID2, timestamp=1496273604148, value=Jan
7 column=d:data, timestamp=1496273604148, value=TestData7
7 column=d:jj_02/03/2017 09:37:56 AM, timestamp=1496273604148, value=11345602/03/2017 09:37:56 AM
例如,您可以使用过滤器列表
scan.setFilter(
new FilterList(
FilterList.Operator.MUST_PASS_ALL,
new myCustomFilterA(),
new myCustomFilterB(),
...
)
);
它不会工作,因为亚历克西,我需要和条件,而且我不需要前缀匹配,我需要在这个精确匹配。我想我需要使用自定义过滤器。这是过滤器列表的一个示例,当然你可以使用Operator.MUST\u PASS\u ALL来设置和条件,关于前缀过滤器,你当然可以使用你自己的过滤器。将更新我的答案