Hive 使用“配置单元导出数据”命令时如何打印输出文件大小;插入覆盖目录";
我正在使用beeline命令将数据导出到hdfs:Hive 使用“配置单元导出数据”命令时如何打印输出文件大小;插入覆盖目录";,hive,hiveql,hadoop2,beeline,hiveserver2,Hive,Hiveql,Hadoop2,Beeline,Hiveserver2,我正在使用beeline命令将数据导出到hdfs: INSERT OVERWRITE DIRECTORY $export_tmp ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe' select * from xxx_table_name; 我想设置echo输出文件大小,例如1024M。如果它在最后一个顶点的多个贴图器或还原器上运行,则可以是多个文件 最简单的方法是在shell中执行
INSERT OVERWRITE DIRECTORY $export_tmp
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.MultiDelimitSerDe'
select * from xxx_table_name;
我想设置echo输出文件大小,例如1024M。如果它在最后一个顶点的多个贴图器或还原器上运行,则可以是多个文件 最简单的方法是在shell中执行
hadoop fs -ls <directory>
也可以使用作业结束时打印的计数器,如HDFS:写入的字节数(不确定此数字是否正确)如果在最后一个顶点的多个映射器或还原器上运行,则可能有多个文件 最简单的方法是在shell中执行
hadoop fs -ls <directory>
也可以使用作业结束时打印的计数器,如HDFS:写入的字节数(不确定此数字是否正确)
!sh hdfs dfs -ls <directory>