配置单元:将CSV文件加载到配置单元表的Shell脚本?
我的MapReduce作业生成一个CSV文件,并将其存储在HDFS中,如下所示:配置单元:将CSV文件加载到配置单元表的Shell脚本?,csv,hadoop,hive,Csv,Hadoop,Hive,我的MapReduce作业生成一个CSV文件,并将其存储在HDFS中,如下所示: hdfs:///data/input/ 它在HDFS中生成两个文件: /data/input/SUCCESS /data/input/part-m-00000 如何在命令行/shell脚本的配置单元表中加载此CSV文件?HDFS+HCatalog将目录视为单个文件,如果它们包含SequenceFile 做您所要求的事情的最简单方法是简单的,您使用的位置只是目录,而不是整个0000001etc文件的路径
hdfs:///data/input/
它在HDFS中生成两个文件:
/data/input/SUCCESS
/data/input/part-m-00000
如何在命令行/shell脚本的配置单元表中加载此CSV文件?HDFS+HCatalog将目录视为单个文件,如果它们包含SequenceFile 做您所要求的事情的最简单方法是简单的,您使用的位置只是目录,而不是整个0000001etc文件的路径