Hadoop ORC模式演化

Hadoop ORC模式演化,hadoop,hive,schema,orc,Hadoop,Hive,Schema,Orc,在浏览了一个示例ORC文件之后,我了解到ORC文件格式不存储任何列信息,事实上,所有列名都将替换为_C0to _cn,在这种情况下,如何为ORC表实现适当的模式演变?ORC格式不存储任何有关配置单元列名的信息。如果ORC文件是使用PIG创建的,则存在存储列信息的错误。您可以在下面找到详细信息 我认为ORC文件格式(以及其他)依赖于Hive Metastore来获取这些信息。如果运行descripe formatted,将获得架构信息 差不多 # col_name da

在浏览了一个示例ORC文件之后,我了解到ORC文件格式不存储任何列信息,事实上,所有列名都将替换为_C0to _cn,在这种情况下,如何为ORC表实现适当的模式演变?

ORC格式不存储任何有关配置单元列名的信息。如果ORC文件是使用
PIG
创建的,则存在存储列信息的错误。您可以在下面找到详细信息

我认为ORC文件格式(以及其他)依赖于
Hive Metastore
来获取这些信息。如果运行
descripe formatted
,将获得架构信息

差不多

# col_name              data_type               comment

name                    string

同意。但重点是关于模式进化。假设我们使用的拼花文件实际上允许用户存储模式中的所有列信息,如果可以使用此文件修改列,我们如何在hive ORC文件中实现此功能?