Hadoop 映射hbase表中的特定区域数据

Hadoop 映射hbase表中的特定区域数据,hadoop,hbase,Hadoop,Hbase,我是Hadoop和Hbase的新手。我想知道是否有一种方法可以将reduce映射到hbase表中某些选定的数据区域。我的意思是,有没有一种方法可以指定Map reduce应该使用表中的哪些区域,而不是使用完整的表并根据区域的数量拆分任务。一些代码片段将非常有帮助 非常感谢。您可以设置处理的开始行和结束行。如果只执行一次,则可以在HBase web UI中获取该区域的开始和停止键 它可以通过使用TableMapReduceUtil来完成,TableMapReduceUtil接受扫描作为参数。在内部

我是Hadoop和Hbase的新手。我想知道是否有一种方法可以将reduce映射到hbase表中某些选定的数据区域。我的意思是,有没有一种方法可以指定Map reduce应该使用表中的哪些区域,而不是使用完整的表并根据区域的数量拆分任务。一些代码片段将非常有帮助


非常感谢。

您可以设置处理的开始行和结束行。如果只执行一次,则可以在HBase web UI中获取该区域的开始和停止键
它可以通过使用TableMapReduceUtil来完成,TableMapReduceUtil接受扫描作为参数。在内部(我认为)它调用setStartRow和setStopRow以实现TableInputFormat)
您可以在这里找到示例:

(在页面中搜索setStartRow)。

谢谢david这正是我要找的。下面是一个小代码片段,说明我是如何做到这一点的。List tableRegions=admin.getTableRegions(tableName);扫描=新扫描();scan.setStartRow(新的ImmutableBytesWritable(tableRegions.get(1.getStartKey()).get());scan.setStopRow(新的ImmutableBytesWritable(tableRegions.get(1.getEndKey()).get());TableMapReduceUtil.initTableMapperJob(表,扫描,AnalyzeMapper.class,Text.class,IntWritable.class,作业)。。。。。