Hadoop 当root为数组时,使用regex或json SerDe创建配置单元表

Hadoop 当root为数组时,使用regex或json SerDe创建配置单元表,hadoop,hive,hive-serde,Hadoop,Hive,Hive Serde,我的数据是这种格式的 [{“field1”:“data1”,“field2”:100,“field3”:“more data1”,“field4”:123.001}] [{“field1”:“data2”,“field2”:200,“field3”:“more data2”,“field4”:123.002}] [{“field1”:“data3”,“field2”:300,“field3”:“more data3”,“field4”:123.003}] [{“field1”:“data4”,“

我的数据是这种格式的

[{“field1”:“data1”,“field2”:100,“field3”:“more data1”,“field4”:123.001}]

[{“field1”:“data2”,“field2”:200,“field3”:“more data2”,“field4”:123.002}]

[{“field1”:“data3”,“field2”:300,“field3”:“more data3”,“field4”:123.003}]

[{“field1”:“data4”,“field2”:400,“field3”:“more data4”,“field4”:123.004}]

(每一行是一个只有一个对象的数组),我想围绕它创建一个配置单元表

如果json周围没有
[]
,那么我可以很容易地使用默认的json serde
行格式serde
“org.apache.hive.hcatalog.data.JsonSerDe”

regex-serde的问题是字段的顺序可能会改变,并且很难提取精确的值


如何使用这种数据格式创建配置单元表

您应该能够使用
数组