Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop 从配置单元中的非嵌套数据创建嵌套数据_Hadoop_Hive_Hiveql_Parquet - Fatal编程技术网

Hadoop 从配置单元中的非嵌套数据创建嵌套数据

Hadoop 从配置单元中的非嵌套数据创建嵌套数据,hadoop,hive,hiveql,parquet,Hadoop,Hive,Hiveql,Parquet,是否有任何方法可以从未嵌套的数据创建配置单元中的嵌套数据 例如: 源表 id zip_code 123 12345 123 23456 123 56789 234 12345 234 99999 像这样 id zipcode 123 12345,23456,56789 234 12345,99999 请注意,id的zipcode数可能会有所不同 select id , concat_ws(',',collect_set(zip_code)) as zipcode from y

是否有任何方法可以从未嵌套的数据创建配置单元中的嵌套数据

例如: 源表

id zip_code
123 12345
123 23456
123 56789
234 12345
234 99999
像这样

id zipcode
123 12345,23456,56789
234 12345,99999
请注意,id的zipcode数可能会有所不同

select id
     , concat_ws(',',collect_set(zip_code)) as zipcode 
  from your_table 
 group by id
collect_set()将删除邮政编码集合中的重复项。如果您需要副本,请使用collect_list代替

可能的副本