Hadoop 查询时,作为拼花文件的外部配置单元表返回NULL
我使用map reduce作业创建了一个Hadoop 查询时,作为拼花文件的外部配置单元表返回NULL,hadoop,hive,hdfs,parquet,Hadoop,Hive,Hdfs,Parquet,我使用map reduce作业创建了一个.parquet文件。现在我想在这个文件的顶部创建一个外部表。命令如下: CREATE EXTERNAL TABLE testparquet ( NAME STRING, AGE INT ) STORED AS PARQUET LOCATION 'file location' 该表已成功创建,但当我使用simpleSELECT*查询该表时,所有字段的数据均为NULL。hive的版本是0.13 有什么我遗漏的吗?当使用外部文件时,您需要显式地将
.parquet
文件。现在我想在这个文件的顶部创建一个外部表。命令如下:
CREATE EXTERNAL TABLE testparquet (
NAME STRING,
AGE INT
)
STORED AS PARQUET
LOCATION 'file location'
该表已成功创建,但当我使用simpleSELECT*
查询该表时,所有字段的数据均为NULL。hive的版本是0.13
有什么我遗漏的吗?当使用
外部文件时,您需要显式地将了解数据架构的元数据存储与实际数据本身同步
通常,您将使用invalidatemetadata
命令强制以下查询重新读取数据。如果只有一个表已更新,也可以使用REFRESH