Apache spark 使用PySpark将列转换为小写
我想将“通道”列中的所有值转换为小写。我在jupyter笔记本中使用PySpark创建了Apache spark 使用PySpark将列转换为小写,apache-spark,pyspark,lowercase,Apache Spark,Pyspark,Lowercase,我想将“通道”列中的所有值转换为小写。我在jupyter笔记本中使用PySpark创建了df。我尝试了来自的代码,但出现错误。所以它不是一个复制品 我的数据如下所示: id Channel Brand 123 Hair Fashion 124 Nails Fashion 我希望是这样的: id Channel Brand 123 hair Fashion 124 nails Fashi
df
。我尝试了来自的代码,但出现错误。所以它不是一个复制品
我的数据如下所示:
id Channel Brand
123 Hair Fashion
124 Nails Fashion
我希望是这样的:
id Channel Brand
123 hair Fashion
124 nails Fashion
我尝试了以下方法:
new_df = df.select(lower(df.Channel)).alias('Channel')
它将值转换为小写,但我正在丢失其他列。您只需执行以下操作:
new_df = df.withColumn('Channel', lower(df.Channel))
这也将保留其他列