Pyspark:在udf中传递多个列

Pyspark:在udf中传递多个列,pyspark,apache-spark-sql,user-defined-functions,Pyspark,Apache Spark Sql,User Defined Functions,我的问题与类似,但不是udf,而是需要使用pandas\u udf 我有一个spark数据框,它有很多列(列的数量不同),我需要在它们上应用一个自定义函数(例如sum)。我知道我可以对列名进行硬编码,但当列数不同时,硬编码就不起作用了 请参见示例:

我的问题与类似,但不是
udf
,而是需要使用
pandas\u udf

我有一个spark数据框,它有很多列(列的数量不同),我需要在它们上应用一个自定义函数(例如sum)。我知道我可以对列名进行硬编码,但当列数不同时,硬编码就不起作用了

请参见示例: