Hadoop 如果我们使用DistCp命令,块大小从Cluster1到Cluster2的变化如何?

Hadoop 如果我们使用DistCp命令,块大小从Cluster1到Cluster2的变化如何?,hadoop,distcp,Hadoop,Distcp,我正在处理“DistCp”命令,以便将几个关键文件从Cluster1移动到Cluster2。以前,这些关键文件的块大小为64MB。现在转到Cluster2[它的块大小为128MB) 在DistCp移动之后,关键文件的性能将如何随着Cluster2中的新块大小而提高?性能是提高还是降低?这取决于您的文件。Hadoop文件应该按顺序读取,如果您的文件很大(比如Gbs或Tbs)如果您增加块大小,则会提高性能,因为这会减少要执行的任务数。使用Distcp复制不会保持文件的块属性,因为每个群集的块配置都不

我正在处理“DistCp”命令,以便将几个关键文件从Cluster1移动到Cluster2。以前,这些关键文件的块大小为64MB。现在转到Cluster2[它的块大小为128MB)


在DistCp移动之后,关键文件的性能将如何随着Cluster2中的新块大小而提高?性能是提高还是降低?

这取决于您的文件。Hadoop文件应该按顺序读取,如果您的文件很大(比如Gbs或Tbs)如果您增加块大小,则会提高性能,因为这会减少要执行的任务数。使用Distcp复制不会保持文件的块属性,因为每个群集的块配置都不同