Hive 使用“配置单元导出数据”命令时如何打印输出文件大小;插入覆盖目录";

Hive 使用“配置单元导出数据”命令时如何打印输出文件大小;插入覆盖目录";,hive,hiveql,hadoop2,beeline,hiveserver2,Hive,Hiveql,Hadoop2,Beeline,Hiveserver2,我正在使用beeline命令将数据导出到hdfs: INSERT OVERWRITE DIRECTORY $export_tmp ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe' select * from xxx_table_name; 我想设置echo输出文件大小,例如1024M。如果它在最后一个顶点的多个贴图器或还原器上运行,则可以是多个文件 最简单的方法是在shell中执行

我正在使用beeline命令将数据导出到hdfs:

INSERT OVERWRITE  DIRECTORY $export_tmp
  ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe' 
   select * from xxx_table_name;

我想设置echo输出文件大小,例如1024M。

如果它在最后一个顶点的多个贴图器或还原器上运行,则可以是多个文件

最简单的方法是在shell中执行

hadoop fs -ls <directory> 

也可以使用作业结束时打印的计数器,如HDFS:写入的字节数(不确定此数字是否正确)

如果在最后一个顶点的多个映射器或还原器上运行,则可能有多个文件

最简单的方法是在shell中执行

hadoop fs -ls <directory> 
也可以使用作业结束时打印的计数器,如HDFS:写入的字节数(不确定此数字是否正确)

!sh hdfs dfs -ls <directory>