PySpark Dataframe:在列的每个值后面附加一个字

PySpark Dataframe:在列的每个值后面附加一个字,dataframe,pyspark,Dataframe,Pyspark,我想在pyspark数据帧中的每个列的值后面附加一个单词(例如,从单词列表中)。我想把它转换成pandas框架,因为它更容易,但我需要在pyspark上完成。有什么想法吗?谢谢:)您可以使用concat功能轻松完成: from pyspark.sql import functions as F for col in df.columns: df.withColumn(col, F.concat(F.col(col), F.lit("new_word")) 请出示你试过的东西。

我想在pyspark数据帧中的每个列的值后面附加一个单词(例如,从单词列表中)。我想把它转换成pandas框架,因为它更容易,但我需要在pyspark上完成。有什么想法吗?谢谢:)

您可以使用
concat
功能轻松完成:

from pyspark.sql import functions as F
for col in df.columns:
    df.withColumn(col, F.concat(F.col(col), F.lit("new_word"))

请出示你试过的东西。