粘附爬虫以读取Json数组

粘附爬虫以读取Json数组,json,amazon-web-services,aws-glue,Json,Amazon Web Services,Aws Glue,我有一个Json数组文件,格式如下:- [[{Key1:Value1},{Key2:Value2},{Key3:Value3}],{Key1:Value4},{Key2:Value5},{Key3:Value6}] 我需要使用AWS glue对上述文件进行爬网,并将每个键作为模式中的一列来读取json模式。我尝试使用标准json分类器,但它似乎不起作用,模式作为数组加载。 我需要从S3读取json文件并将其加载到RDS数据库中。任何关于如何通过粘合作业或分类器进行转换的建议都会很有帮助。创建一个

我有一个Json数组文件,格式如下:- [[{Key1:Value1},{Key2:Value2},{Key3:Value3}],{Key1:Value4},{Key2:Value5},{Key3:Value6}]

我需要使用AWS glue对上述文件进行爬网,并将每个键作为模式中的一列来读取json模式。我尝试使用标准json分类器,但它似乎不起作用,模式作为数组加载。
我需要从S3读取json文件并将其加载到RDS数据库中。任何关于如何通过粘合作业或分类器进行转换的建议都会很有帮助。

创建一个自定义JSON分类器,并将JSON路径指定为$[*]


有关更多详细信息,请参阅AWS文档的链接-

我遇到了同样的问题。我的一个解决方案是使用
jq
格式化json文件,然后将该文件重新上传到S3。在这里,使用任何其他类型的json格式化工具也会有所帮助

其他方法我还不知道,希望这对我有帮助