Pyspark 如何在数据框中添加最大日期?

Pyspark 如何在数据框中添加最大日期?,pyspark,Pyspark,我需要添加一列,它是pyspark数据帧中日期的最大值 获取错误:“TypeError:“Column”对象不可调用” 尝试使用max(Part3DF.latest\u installation\u time1)Part3DF.latest_installation_time1将返回一个没有max函数的列。获取不可预测的错误:AnalysisException:u“分组表达式序列为空,“transaction_time”不是聚合函数。Wrap'(max(latest_installation_t

我需要添加一列,它是pyspark数据帧中日期的最大值

获取错误:
“TypeError:“Column”对象不可调用”


尝试使用
max(Part3DF.latest\u installation\u time1)
Part3DF.latest_installation_time1
将返回一个没有
max
函数的列。

获取不可预测的错误:AnalysisException:u“分组表达式序列为空,“
transaction_time
”不是聚合函数。Wrap'(max(
latest_installation_time1
)作为窗口函数中的
最新安装时间
),或在first()中换行“
事务时间
”(或第一个值),如果您不关心得到的是哪个值[交易时间161,飞机位置174,飞机注册177,零件号182,序列号183,复合零件类型303,发动机类型312,发动机型号313,零件组代码341,注意发布一些示例数据(输入和输出)和代码?这会更容易帮助。:)
Part3DF = Part3DF.withColumn('latest_installation_time1', to_date(unix_timestamp(col('transaction_time'),'MM-dd-yyyy').cast("timestamp")))

Part3DF = Part3DF.withColumn('latest_installation_time', (Part3DF.latest_installation_time1).max())