Dataframe 具有复杂数据结构的配置单元列,在读取拼花地板数据后提供空值
将拼花地板数据读取为dataframe后,如下图所示: 但是现在我想用hive读取拼花地板数据。我将CREATETABLE语句编写为:Dataframe 具有复杂数据结构的配置单元列,在读取拼花地板数据后提供空值,dataframe,hive,hiveql,cloudera-cdh,Dataframe,Hive,Hiveql,Cloudera Cdh,将拼花地板数据读取为dataframe后,如下图所示: 但是现在我想用hive读取拼花地板数据。我将CREATETABLE语句编写为: CREATE EXTERNAL TABLE test_13102019 ( `DeviceInfo` STRUCT< `name`: STRING, `serialNumber`: STRING > ) STORED as PARQUET LOCATION 'x
CREATE EXTERNAL TABLE test_13102019 (
`DeviceInfo` STRUCT<
`name`: STRING,
`serialNumber`: STRING
>
)
STORED as PARQUET
LOCATION 'x/y';
创建外部表测试\u 13102019(
`DeviceInfo`STRUCT<
`name`:STRING,
`serialNumber`:STRING
>
)
作为拼花地板储存
位置“x/y”;
但是当我使用select*fromtest_13102019 limit 10读取数据时代码>
我得到的结果是空值
请帮我做同样的事情。我看不到任何分区信息的详细信息。可能这就是为什么最终结果集为空。您总是需要添加分区键。如何为相同的分区添加分区键。假设在这种情况下,我们只有两列,它们实际上是随机的。怎么做,先生。这个拼花文件是一个单独的文件,在一个特定的位置,我只想读它。好的。。让我们在创建创建外部表测试时尝试此查询_13102019(“name
”字符串、serialNumber
”字符串)位置“x/y”;我无法更改项目不允许的列名。我看不到任何分区信息的详细信息。可能这就是为什么最终结果集为空。您总是需要添加分区键。如何为相同的分区添加分区键。假设在这种情况下,我们只有两列,它们实际上是随机的。怎么做,先生。这个拼花文件是一个单独的文件,在一个特定的位置,我只想读它。好的。。让我们在创建创建外部表测试时尝试此查询_13102019(“name
”字符串、serialNumber
”字符串)位置“x/y”;我无法更改项目不允许的列名