Hadoop 是否可以使用不同的模式在拼花地板文件上创建外部配置单元表?

Hadoop 是否可以使用不同的模式在拼花地板文件上创建外部配置单元表?,hadoop,hive,parquet,Hadoop,Hive,Parquet,我的拼花地板文件结构如下: +------+------------------+------------------+ | col1 | col2 | col3 | +------+------------------+------------------+ | v0 | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } | +------+------------------+------------------+

我的拼花地板文件结构如下:

+------+------------------+------------------+
| col1 |       col2       |        col3      |
+------+------------------+------------------+
|  v0  | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+
+-------+-----+-----+-----+-----+
| col1  |  k1 |  k2 |  k3 |  k4 |
+-------+-----+-----+-----+-----+
|  v0   |  v1 |  v2 |  v3 |  v4 |
+-------+-----+-----+-----+-----+
col2和col3是映射列。 我希望在此基础上创建一个配置单元表,其模式如下:

+------+------------------+------------------+
| col1 |       col2       |        col3      |
+------+------------------+------------------+
|  v0  | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+
+-------+-----+-----+-----+-----+
| col1  |  k1 |  k2 |  k3 |  k4 |
+-------+-----+-----+-----+-----+
|  v0   |  v1 |  v2 |  v3 |  v4 |
+-------+-----+-----+-----+-----+

是否可以创建上述映射?我熟悉在hbase表上创建外部表的类似过程。

您可以通过以下步骤完成:

1.创建临时表并按原样存储文件(映射列类型)

2.创建具有所需最终结构的第二个表


3.从临时表插入第二个表。插入时,您需要使用一些功能,如:修剪、拆分等。您可以使用。

您可以通过以下步骤完成:

1.创建临时表并按原样存储文件(映射列类型)

2.创建具有所需最终结构的第二个表

3.从临时表插入第二个表。当您插入时,您需要使用一些功能,如:修剪、拆分等。您可以使用