Hadoop TDCH中配置单元表的拆分大小

Hadoop TDCH中配置单元表的拆分大小,hadoop,split,mapreduce,hive,teradata,Hadoop,Split,Mapreduce,Hive,Teradata,我正在使用TDCH将配置单元数据导出到teradata表中。为此,我需要指定TDCH作业的映射器数量所以,我的问题是“我们给TDCH作业的映射器选项的数量是否只是给TDCH的一个提示?或者TDCH创建的映射器总数是否始终等于(TDCH作业的)选项中给出的映射器数量?” 我的假设是,映射器的数量主要取决于分割大小,而不是给定的映射器数量(在TDCH作业选项中)。对于TDCH作业,我的假设正确吗? 另外,对于配置单元表,如何定义拆分大小?这是根据行数定义的吗?或者它只是根据数据的大小(如60MB或1

我正在使用TDCH将配置单元数据导出到teradata表中。为此,我需要指定TDCH作业的映射器数量
所以,我的问题是“我们给TDCH作业的映射器选项的数量是否只是给TDCH的一个提示?或者TDCH创建的映射器总数是否始终等于(TDCH作业的)选项中给出的映射器数量?”

我的假设是,映射器的数量主要取决于分割大小,而不是给定的映射器数量(在TDCH作业选项中)。对于TDCH作业,我的假设正确吗?

另外,对于配置单元表,如何定义拆分大小?这是根据行数定义的吗?或者它只是根据数据的大小(如60MB或120MB等)定义的,类似于“文本文件”之类的情况

“我们给TDCH作业的映射器数量选项只是给TDCH的一个提示吗?或者TDCH创建的映射器总数始终等于(TDCH作业的)选项中给出的映射器数量吗?”

TDCH中的Splitsize始终等于指定的“映射器数量”(我在一个TDCH教程中阅读了这篇文章)。因此,映射器的数量不仅仅是一个提示(与传统的mapreduce编程不同),它只是分割的数量

因为它等于拆分数,所以为TDCH作业生成的映射器总数始终等于运行作业时指定的“映射器数”(选项)