Hadoop 表上的配置单元分区

Hadoop 表上的配置单元分区,hadoop,partitioning,hiveql,Hadoop,Partitioning,Hiveql,当我们对一个表进行分区时,create语句中没有提到要对其进行分区的列,而在PARTITED by中单独使用这些列。这背后的原因是什么 CREATE TABLE REGISTRATION DATA ( userid BIGINT, First_Name STRING, Last_Name STRING, address1 STRING, address2 ST

当我们对一个表进行分区时,create语句中没有提到要对其进行分区的列,而在PARTITED by中单独使用这些列。这背后的原因是什么

CREATE TABLE REGISTRATION DATA   (
    userid             BIGINT,
    First_Name        STRING,
    Last_Name         STRING,
    address1           STRING,
    address2           STRING,
    city               STRING,
    zip_code           STRING,
    state              STRING

)
PARTITION BY  (
    REGION             STRING,
    COUNTRY            STRING
) 

我们在
配置单元
中创建的
分区
生成了一个伪列,我们可以直接在其上查询,而不必在create语句中使用它们


因此,当我们在表本身的数据中包含分区列(创建查询)时,我们将得到类似于语义分析中的
错误的错误。在分区列“

中重复的列此声明非常清楚。清晰可能是其背后的原因。