Hive 创建配置单元表以从拼花/avro模式读取拼花文件

Hive 创建配置单元表以从拼花/avro模式读取拼花文件,hive,avro,parquet,Hive,Avro,Parquet,我们正在寻找一种解决方案,以便创建一个外部配置单元表,根据拼花/avro模式从拼花文件中读取数据 换句话说,如何从拼花地板/avro模式生成配置单元表 谢谢:)使用avro模式尝试以下操作: CREATE TABLE avro_test ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe' STORED AS AVRO TBLPROPERTIES ('avro.schema.url'='myHost/myAvroSchem

我们正在寻找一种解决方案,以便创建一个外部配置单元表,根据拼花/avro模式从拼花文件中读取数据

换句话说,如何从拼花地板/avro模式生成配置单元表


谢谢:)

使用avro模式尝试以下操作:

CREATE TABLE avro_test ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe' STORED AS AVRO TBLPROPERTIES ('avro.schema.url'='myHost/myAvroSchema.avsc'); 

CREATE EXTERNAL TABLE parquet_test LIKE avro_test STORED AS PARQUET LOCATION 'hdfs://myParquetFilesPath';

中也有同样的问题,我可以直接从拼花地板文件创建表格吗?或者如何从特定的拼花文件中获取Avro模式?@GaryGauh对于您的第二个问题,这里是我的答案。使用拼花工具,您可以提取特定拼花文件的Avro模式。请参考此链接了解更多详细信息:它对我有效,但我可以使用拼花模式(
org.apache.parquet.schema.MessageType
)创建表吗?