Date Pypark查找具有最高金额的日期。

Date Pypark查找具有最高金额的日期。,date,timestamp,pyspark,Date,Timestamp,Pyspark,我有以下建议: 时间定位金额 2012-07-20 01:00:00A 3300 2012-01-04 17:29:00B300 2012-07-20 01:00:00A200 2012-01-04 17:29:00B500 2012-01-04 17:29:00c333 我想输出金额最高的日期 输出: 2012-07-20 如何使用pyspark实现这一点?首先收集最大值,然后进行过滤怎么样 max_amt = df.select(max(df.amt)).collect()[0][0] df

我有以下建议:

时间定位金额
2012-07-20 01:00:00A 3300
2012-01-04 17:29:00B300
2012-07-20 01:00:00A200
2012-01-04 17:29:00B500
2012-01-04 17:29:00c333

我想输出金额最高的日期

输出: 2012-07-20


如何使用pyspark实现这一点?

首先收集最大值,然后进行过滤怎么样

max_amt = df.select(max(df.amt)).collect()[0][0]
df.filter(df.amt == lit(max_amt)).select(to_date('time')).show()
+------------+
|todate(time)|
+------------+
|  2012-07-20|
+------------+