Apache spark 使用PySpark将列转换为小写

Apache spark 使用PySpark将列转换为小写,apache-spark,pyspark,lowercase,Apache Spark,Pyspark,Lowercase,我想将“通道”列中的所有值转换为小写。我在jupyter笔记本中使用PySpark创建了df。我尝试了来自的代码,但出现错误。所以它不是一个复制品 我的数据如下所示: id Channel Brand 123 Hair Fashion 124 Nails Fashion 我希望是这样的: id Channel Brand 123 hair Fashion 124 nails Fashi

我想将“通道”列中的所有值转换为小写。我在jupyter笔记本中使用PySpark创建了
df
。我尝试了来自的代码,但出现错误。所以它不是一个复制品

我的数据如下所示:

id     Channel     Brand
123    Hair        Fashion
124    Nails       Fashion 
我希望是这样的:

id     Channel     Brand
123    hair        Fashion
124    nails       Fashion 
我尝试了以下方法:

new_df = df.select(lower(df.Channel)).alias('Channel')
它将值转换为小写,但我正在丢失其他列。

您只需执行以下操作:

new_df = df.withColumn('Channel', lower(df.Channel))
这也将保留其他列