Hive 如何将拼花地板文件加载到配置单元表
我从mysql中导入了一个sqoop,得到了一个csv文件。 该文件的内容如下所示Hive 如何将拼花地板文件加载到配置单元表,hive,sqoop,parquet,Hive,Sqoop,Parquet,我从mysql中导入了一个sqoop,得到了一个csv文件。 该文件的内容如下所示 1,KM,Skypark,null,2017-02-21 14:40:49.0,null 2,KM,null,null,2017-02-21 14:40:49.0,null 3,HD,null,null,2017-02-21 14:40:49.0,null 4,AB,SD,USA,2017-02-21 14:40:49.0,null 5,ABa,SaD,US,2017-02-21 14:40:49.0,null
1,KM,Skypark,null,2017-02-21 14:40:49.0,null
2,KM,null,null,2017-02-21 14:40:49.0,null
3,HD,null,null,2017-02-21 14:40:49.0,null
4,AB,SD,USA,2017-02-21 14:40:49.0,null
5,ABa,SaD,US,2017-02-21 14:40:49.0,null
6,DF,SDF,SF,2017-02-21 14:40:49.0,null
7,DF,SDF,SF,2017-02-21 14:41:44.0,null
8,DF,SDF,SF,2017-02-21 14:44:55.0,null
9,DF,SDF,SF,2017-02-21 14:47:59.0,null
现在,我已经完成了与拼花文件相同的sqoop导入。我有一个扩展名为.parquet的文件
我想使用拼花地板文件创建一个表。我试过以下方法,但它给了我不同的错误
create external table test(id int, name string, address string, nation string, date string) row format delimited fields terminated by ',' stored as parquet;
load data inpath '/user/XXXXX/test' into table test;
我如何得到拼花地板表,以给我准确的结果作为csv表
假设我在存储以前数据的同一文件夹中获得了增量数据。我有身份证10和11的记录。现在,当我将数据从文件夹加载到拼花地板表时,我将获得增量数据作为第一个记录,然后是初始数据
我的意思是这张桌子看起来像
10 ..............
11 ..............
1 ..............
2 ..............
像这样,我希望第一条记录是第一条,最后是增量数据
我们如何才能做到这一点?在创建拼花地板表时,不需要指定以下语句 以“,”结尾的行格式分隔字段 只需指定存储为拼花就足够了
create external table test(id int, name string, address string, nation string, date string) stored as parquet location '/user/XXXXX/test';
创建拼花地板表时,不需要指定以下语句 以“,”结尾的行格式分隔字段 只需指定存储为拼花就足够了
create external table test(id int, name string, address string, nation string, date string) stored as parquet location '/user/XXXXX/test';
请你再看一次这个问题好吗?我已经编辑好这个问题了