Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop MultiTableInputFormat用于比较2个表格,耗时约80分钟_Hadoop_Mapreduce_Hbase - Fatal编程技术网

Hadoop MultiTableInputFormat用于比较2个表格,耗时约80分钟

Hadoop MultiTableInputFormat用于比较2个表格,耗时约80分钟,hadoop,mapreduce,hbase,Hadoop,Mapreduce,Hbase,我正在使用Hbase MultiTableInputFormat比较两个表:表1(700万)和表2(3000万) 在驱动程序中,我传递到扫描(没有任何过滤器)。在我的映射器中,我正在进行比较,并在Reducer中编写摘要 任何特定于此场景的设置都可能会加快此过程。谢谢。您是否使用了扫描仪缓存,它可以提高性能- 示例-scan.setCaching(1000)

我正在使用Hbase MultiTableInputFormat比较两个表:表1(700万)和表2(3000万)

在驱动程序中,我传递到扫描(没有任何过滤器)。在我的映射器中,我正在进行比较,并在Reducer中编写摘要


任何特定于此场景的设置都可能会加快此过程。谢谢。

您是否使用了扫描仪缓存,它可以提高性能- 示例-scan.setCaching(1000)