Hive 作为蜂巢执行引擎,Tez总是比MR更好吗?

Hive 作为蜂巢执行引擎,Tez总是比MR更好吗?,hive,mapreduce,hiveql,apache-tez,Hive,Mapreduce,Hiveql,Apache Tez,对于较小的查询(以交互方式预期结果,以分钟为单位,比小时为单位),Tez的性能更好,而对于批量查询(以小时为单位),MR作为执行引擎的性能更好,这是真的吗?或者我们可以说,无论查询类型如何,Tez始终是最佳选择?Tez简化了小规模(低延迟)和大规模(高吞吐量)工作负载的处理。查询越复杂,TEZ带来的好处就越多。对于由单个映射步骤组成的简单查询,很可能根本没有区别,因为没有什么需要优化的。TEZ将查询表示为单个作业的DAG(有向无环图),并消除了不必要的步骤,如读/写持久存储、对每个映射的输出进行

对于较小的查询(以交互方式预期结果,以分钟为单位,比小时为单位),Tez的性能更好,而对于批量查询(以小时为单位),MR作为执行引擎的性能更好,这是真的吗?或者我们可以说,无论查询类型如何,Tez始终是最佳选择?

Tez简化了小规模(低延迟)和大规模(高吞吐量)工作负载的处理。查询越复杂,TEZ带来的好处就越多。对于由单个映射步骤组成的简单查询,很可能根本没有区别,因为没有什么需要优化的。TEZ将查询表示为单个作业的DAG(有向无环图),并消除了不必要的步骤,如读/写持久存储、对每个映射的输出进行排序,还支持容器重用。Tez永远是最好的选择,对于简单的查询,它不会比MR差,对于复杂的查询,它会更好。考虑到这一点:对于MR和TEZ,你必须调整不同的配置参数集,有很多TEZ特定的和大量的MR特定的。选择TEZ,你将简化你的生活,即使在没有什么需要优化的情况下。也