Hadoop 是否可以使用不同的模式在拼花地板文件上创建外部配置单元表?
我的拼花地板文件结构如下:Hadoop 是否可以使用不同的模式在拼花地板文件上创建外部配置单元表?,hadoop,hive,parquet,Hadoop,Hive,Parquet,我的拼花地板文件结构如下: +------+------------------+------------------+ | col1 | col2 | col3 | +------+------------------+------------------+ | v0 | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } | +------+------------------+------------------+
+------+------------------+------------------+
| col1 | col2 | col3 |
+------+------------------+------------------+
| v0 | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+
+-------+-----+-----+-----+-----+
| col1 | k1 | k2 | k3 | k4 |
+-------+-----+-----+-----+-----+
| v0 | v1 | v2 | v3 | v4 |
+-------+-----+-----+-----+-----+
col2和col3是映射列。
我希望在此基础上创建一个配置单元表,其模式如下:
+------+------------------+------------------+
| col1 | col2 | col3 |
+------+------------------+------------------+
| v0 | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+
+-------+-----+-----+-----+-----+
| col1 | k1 | k2 | k3 | k4 |
+-------+-----+-----+-----+-----+
| v0 | v1 | v2 | v3 | v4 |
+-------+-----+-----+-----+-----+
是否可以创建上述映射?我熟悉在hbase表上创建外部表的类似过程。您可以通过以下步骤完成: 1.创建临时表并按原样存储文件(映射列类型) 2.创建具有所需最终结构的第二个表
3.从临时表插入第二个表。插入时,您需要使用一些功能,如:修剪、拆分等。您可以使用。您可以通过以下步骤完成: 1.创建临时表并按原样存储文件(映射列类型) 2.创建具有所需最终结构的第二个表 3.从临时表插入第二个表。当您插入时,您需要使用一些功能,如:修剪、拆分等。您可以使用