Hadoop 当root为数组时,使用regex或json SerDe创建配置单元表
我的数据是这种格式的Hadoop 当root为数组时,使用regex或json SerDe创建配置单元表,hadoop,hive,hive-serde,Hadoop,Hive,Hive Serde,我的数据是这种格式的 [{“field1”:“data1”,“field2”:100,“field3”:“more data1”,“field4”:123.001}] [{“field1”:“data2”,“field2”:200,“field3”:“more data2”,“field4”:123.002}] [{“field1”:“data3”,“field2”:300,“field3”:“more data3”,“field4”:123.003}] [{“field1”:“data4”,“
[{“field1”:“data1”,“field2”:100,“field3”:“more data1”,“field4”:123.001}]
[{“field1”:“data2”,“field2”:200,“field3”:“more data2”,“field4”:123.002}]
[{“field1”:“data3”,“field2”:300,“field3”:“more data3”,“field4”:123.003}]
[{“field1”:“data4”,“field2”:400,“field3”:“more data4”,“field4”:123.004}]
(每一行是一个只有一个对象的数组),我想围绕它创建一个配置单元表
如果json周围没有[]
,那么我可以很容易地使用默认的json serde行格式serde
“org.apache.hive.hcatalog.data.JsonSerDe”
regex-serde的问题是字段的顺序可能会改变,并且很难提取精确的值
如何使用这种数据格式创建配置单元表 您应该能够使用
数组