Amazon s3 [AWS Athena]:如何将DISTINCT与SELECT ALL和ORDER BY一起使用

Amazon s3 [AWS Athena]:如何将DISTINCT与SELECT ALL和ORDER BY一起使用,amazon-s3,hive,distinct,amazon-athena,Amazon S3,Hive,Distinct,Amazon Athena,我使用的是AWS Athena,我有一个疑问: SELECT * FROM foo ORDER BY purchase_date ASC 但我想去重复记录 因为这是雅典娜,它需要并行处理记录,所以我不确定如何编写DISTINCT子句 如何进行此查询,使其在结果集中没有任何重复记录 谢谢只需从中选择不同的c1、c2…即可tbl@VamsiPrabhala这不起作用,因为AWS雅典娜的本质是流式记录,因为我有一个ORDER BY子句,它不知何故需要所有的记录。。。不管怎样,让我试试你说的,非常感谢

我使用的是AWS Athena,我有一个疑问:

SELECT * FROM foo ORDER BY purchase_date ASC
但我想去重复记录

因为这是雅典娜,它需要并行处理记录,所以我不确定如何编写DISTINCT子句

如何进行此查询,使其在结果集中没有任何重复记录


谢谢

只需从中选择不同的c1、c2…即可tbl@VamsiPrabhala这不起作用,因为AWS雅典娜的本质是流式记录,因为我有一个ORDER BY子句,它不知何故需要所有的记录。。。不管怎样,让我试试你说的,非常感谢,实现细节你不必担心about@VamsiPrabhala所以我确实从tbl中选择了不同的foo,bar,但是我只得到了结果集中的foo和bar列。如何获取所有列?这似乎是可行的:从SELECT*中选择*,按foo分区的行数作为tbl中的行数,其中行数=1 order by bar,我从中获得: