Hadoop 嵌套HBase实体中的高效搜索
如果我在同一个HBase实体中跟踪并存储一组嵌套实体(以受益于HBase的单行ACID属性),是否可以高效地搜索这些嵌套实体,甚至使用MapReduce来决定是否使用特定标准选择封装(父)实体 例如,我有一个客户实体,其中嵌套了订单实体 CustomerInfo和Orders是列族。 对于orders列系列(这里很有意思),1、2…6是列名(在HBase中是动态的,可以动态添加),它们旁边的文本是订单实体详细信息(我将这些详细信息序列化为文本,但序列化并不重要,因为HBase不在乎) 如果我有很多像这个客户实体这样的实体(更多细节见下文第3节)Hadoop 嵌套HBase实体中的高效搜索,hadoop,mapreduce,hbase,Hadoop,Mapreduce,Hbase,如果我在同一个HBase实体中跟踪并存储一组嵌套实体(以受益于HBase的单行ACID属性),是否可以高效地搜索这些嵌套实体,甚至使用MapReduce来决定是否使用特定标准选择封装(父)实体 例如,我有一个客户实体,其中嵌套了订单实体 CustomerInfo和Orders是列族。 对于orders列系列(这里很有意思),1、2…6是列名(在HBase中是动态的,可以动态添加),它们旁边的文本是订单实体详细信息(我将这些详细信息序列化为文本,但序列化并不重要,因为HBase不在乎) 如果我有
1:“项目A;成本:$12”
你可以试试
1-ItemA:“12”
或
项目A-1:“12”
或者可以将值存储在整数字节而不是字符串中,这样您就可以使用scan with根据需要过滤返回的结果 或者,您可以尝试多层体系结构,其中有用于处理的数据表和用于实时访问的聚合表