Performance 蜂箱查询卡在执行过程中

Performance 蜂箱查询卡在执行过程中,performance,hadoop,hive,Performance,Hadoop,Hive,各位同事: 在配置单元中使用sql脚本执行bash文件时,我遇到了一个问题-它总是停留在同一个位置map=100%,reduce=67% 我尝试使用具有不同变化和其他tunning特征的映射器和还原器编号: SET hive.exec.parallel=true; SET hive.default.fileformat=RCFILE; SET hive.stats.autogather=false; SET hive.exec.compress.output=true; SET mapred.

各位同事:

在配置单元中使用sql脚本执行bash文件时,我遇到了一个问题-它总是停留在同一个位置map=100%,reduce=67%

我尝试使用具有不同变化和其他tunning特征的映射器和还原器编号:

SET hive.exec.parallel=true;
SET hive.default.fileformat=RCFILE;
SET hive.stats.autogather=false;
SET hive.exec.compress.output=true; 
SET mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec; 
SET mapred.output.compression.type=BLOCK;
SET hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
但结果仍然是一样的——它持续返回67%的减少进度

配置单元版本-0.13.0.2.X.X.X

SQL包含从多个源创建的表—多个表的简单联接

你知道怎么调整吗


任何帮助都将不胜感激。

减速器的相位为:

  • 洗牌
  • 分类
  • 减少

@67%被卡住表示洗牌和排序已经完成,但是没有一个分区能够在Reduce阶段成功。Reduce阶段是实际的Reducer代码。这表示您的代码无法完成。您应该检查代码并查看配置单元日志,以了解代码无法运行的原因。

因此,我们发现有多条重复记录,这就是执行受阻的原因。

可能会有帮助-输出信息关于提供的答案的反馈如何?