Hive Cloudera中10个或更多查询并行执行的性能问题

Hive Cloudera中10个或更多查询并行执行的性能问题,hive,cloudera,Hive,Cloudera,我在同一个表的不同列上并行执行10个或多个select查询,然后抛出我的应用程序,一个查询需要2到3分钟。 如果我的查询计数小于或等于5,则并行执行每个查询需要24秒。我正在使用Cloudera-5.14.2。和蜂巢数据库。我尝试了以下解决方案,但无法提高性能 1-TEZ: set hive.execution.engine=tez; 2-矢量化: set hive.vectorized.execution.enabled = true; set hive.vectorized.executi

我在同一个表的不同列上并行执行10个或多个select查询,然后抛出我的应用程序,一个查询需要2到3分钟。 如果我的查询计数小于或等于5,则并行执行每个查询需要24秒。我正在使用Cloudera-5.14.2。和蜂巢数据库。我尝试了以下解决方案,但无法提高性能

1-TEZ:

set hive.execution.engine=tez;
2-矢量化:

set hive.vectorized.execution.enabled = true;
set hive.vectorized.execution.reduce.enabled = true;
3-基于成本的查询优化:

set hive.cbo.enable=true;
set hive.compute.query.using.stats=true;
set hive.stats.fetch.column.stats=true;
set hive.stats.fetch.partition.stats=true;
set hive.stats.autogather=true;
有什么方法可以提高配置单元中并行执行的性能吗。
什么是配置单元的并行执行流。

请提供有关群集大小、虚拟机类型及其资源的详细信息。硬件-4个节点:2个虚拟机位于1个虚拟机监控程序上,2个虚拟机位于另一个虚拟机监控程序上。两个虚拟机监控程序位于同一机架中,并连接到同一机架内交换机(1GB)