Hadoop 找出原始拼花地板文件的大小?

Hadoop 找出原始拼花地板文件的大小?,hadoop,parquet,Hadoop,Parquet,有没有办法确定snappy中压缩的拼花地板文件的未压缩文件大小?我在HDFS目录中有很多拼花地板文件,我试图找出如果数据未压缩,是否有方法计算文件大小 您可以尝试解压缩数据,看看它占用了多少空间。看 也许有一种更优雅的方式我不知道

有没有办法确定snappy中压缩的拼花地板文件的未压缩文件大小?我在HDFS目录中有很多拼花地板文件,我试图找出如果数据未压缩,是否有方法计算文件大小

您可以尝试解压缩数据,看看它占用了多少空间。看

也许有一种更优雅的方式我不知道