Hadoop 表上的配置单元分区
当我们对一个表进行分区时,create语句中没有提到要对其进行分区的列,而在PARTITED by中单独使用这些列。这背后的原因是什么Hadoop 表上的配置单元分区,hadoop,partitioning,hiveql,Hadoop,Partitioning,Hiveql,当我们对一个表进行分区时,create语句中没有提到要对其进行分区的列,而在PARTITED by中单独使用这些列。这背后的原因是什么 CREATE TABLE REGISTRATION DATA ( userid BIGINT, First_Name STRING, Last_Name STRING, address1 STRING, address2 ST
CREATE TABLE REGISTRATION DATA (
userid BIGINT,
First_Name STRING,
Last_Name STRING,
address1 STRING,
address2 STRING,
city STRING,
zip_code STRING,
state STRING
)
PARTITION BY (
REGION STRING,
COUNTRY STRING
)
我们在
配置单元
中创建的分区
生成了一个伪列,我们可以直接在其上查询,而不必在create语句中使用它们
因此,当我们在表本身的数据中包含分区列(创建查询)时,我们将得到类似于语义分析中的
错误的错误。在分区列“
中重复的列此声明非常清楚。清晰可能是其背后的原因。