阅读JSON&;通过AWS Athena存储在S3中的相同格式的CSV
我的S3文件夹中有不同的数据格式- 为所有CSV、JSON和gz格式文件创建了具有相同列的表 现在我通过查询从雅典娜查询数据-阅读JSON&;通过AWS Athena存储在S3中的相同格式的CSV,json,amazon-web-services,amazon-s3,amazon-athena,Json,Amazon Web Services,Amazon S3,Amazon Athena,我的S3文件夹中有不同的数据格式- 为所有CSV、JSON和gz格式文件创建了具有相同列的表 现在我通过查询从雅典娜查询数据- SELECT * FROM test2 WHERE readtime >= '2016-10-12' AND readtime < '2016-10-24' ORDER BY readtime 选择* 来自测试2 其中readtime>=“2016-10-12” 阅读时间
SELECT *
FROM test2
WHERE readtime >= '2016-10-12'
AND readtime < '2016-10-24'
ORDER BY readtime
选择*
来自测试2
其中readtime>=“2016-10-12”
阅读时间<'2016-10-24'
按读取时间排序
我能够从CSV和GZ文件格式获取数据,但不能从JSON文件获取数据。
我应该使用不同的格式来查询JSON文件吗?
及
我可以使用同一个表来查询我用于CSV文件的JSON文件吗?您需要在JSON文件之上创建一个不同的表,该表将使用JsonSerDe。是的,根据Tanveer的回答,您需要为JSON创建一个单独的表。但是,通过最近发布的一个名为Federated Queries的功能(也就是说,在撰写本文时,在
us-east-1
的预览中),您应该能够使用相同的查询实现对两个表的查询。看