Hadoop 如何理解hdfs-du结果

Hadoop 如何理解hdfs-du结果,hadoop,filesystems,Hadoop,Filesystems,我正在尝试使用命令hdfs dfs-du-h列出文件和文件夹的大小。 我使用的命令是hdfs dfs-du-h/path\u name/folder\u name,返回的结果如下 9.2 G 27.5 G /path_name/folder_name/xxx01.parquet 0 0 /path_name/folder_name/xxx02.parquet 19.9 M 59.6 M /path_name/folder_name/xxx03.parquet

我正在尝试使用命令
hdfs dfs-du-h
列出文件和文件夹的大小。 我使用的命令是
hdfs dfs-du-h/path\u name/folder\u name
,返回的结果如下

9.2 G   27.5 G  /path_name/folder_name/xxx01.parquet
0       0       /path_name/folder_name/xxx02.parquet
19.9 M  59.6 M  /path_name/folder_name/xxx03.parquet
我知道hadoop命令行从通用文件系统命令中借用了很多东西,
-du-h
列出了一个人类可读的文件夹/文件大小。但是,(以第一个结果行为例)这两个数字分别
9.2g 27.5g
的含义是什么


谢谢

您的群集复制系数是3。第一个数字是文件的纯大小,第二个数字是带有repicas的文件大小。例如,实际文件大小为9.2 GB。由于复制系数为3,因此具有副本的文件大小为27.5GB

size      disk space consumed with all replicas full_path