Hadoop TDCH中配置单元表的拆分大小_Hadoop_Split_Mapreduce_Hive_Teradata

Hadoop TDCH中配置单元表的拆分大小

hadoop mapreduce hive teradata

Hadoop TDCH中配置单元表的拆分大小,hadoop,split,mapreduce,hive,teradata,Hadoop,Split,Mapreduce,Hive,Teradata,我正在使用TDCH将配置单元数据导出到teradata表中。为此，我需要指定TDCH作业的映射器数量所以，我的问题是“我们给TDCH作业的映射器选项的数量是否只是给TDCH的一个提示？或者TDCH创建的映射器总数是否始终等于（TDCH作业的）选项中给出的映射器数量？” 我的假设是，映射器的数量主要取决于分割大小，而不是给定的映射器数量（在TDCH作业选项中）。对于TDCH作业，我的假设正确吗？另外，对于配置单元表，如何定义拆分大小？这是根据行数定义的吗？或者它只是根据数据的大小（如60MB或1

我正在使用TDCH将配置单元数据导出到teradata表中。为此，我需要指定TDCH作业的映射器数量
所以，我的问题是“我们给TDCH作业的映射器选项的数量是否只是给TDCH的一个提示？或者TDCH创建的映射器总数是否始终等于（TDCH作业的）选项中给出的映射器数量？”

我的假设是，映射器的数量主要取决于分割大小，而不是给定的映射器数量（在TDCH作业选项中）。对于TDCH作业，我的假设正确吗？

另外，对于配置单元表，如何定义拆分大小？这是根据行数定义的吗？或者它只是根据数据的大小（如60MB或120MB等）定义的，类似于“文本文件”之类的情况

“我们给TDCH作业的映射器数量选项只是给TDCH的一个提示吗？或者TDCH创建的映射器总数始终等于（TDCH作业的）选项中给出的映射器数量吗？”

TDCH中的Splitsize始终等于指定的“映射器数量”（我在一个TDCH教程中阅读了这篇文章）。因此，映射器的数量不仅仅是一个提示（与传统的mapreduce编程不同），它只是分割的数量

因为它等于拆分数，所以为TDCH作业生成的映射器总数始终等于运行作业时指定的“映射器数”（选项）