Regex pyspark中列名的字符串操作

Regex pyspark中列名的字符串操作,regex,pyspark,udf,Regex,Pyspark,Udf,这篇文章对如何更改列名进行了概述。 不过,我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗?例如,join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效 例如: 根 |--客户端:字符串(nullable=true) |--分支编号:string(nullable=true)有一个真正简单的解决方案: for name in df.schema.names: df = df.withColumnRenamed(name, name.r

这篇文章对如何更改列名进行了概述。

不过,我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗?例如,join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效

例如: 根 |--客户端:字符串(nullable=true)
|--分支编号:string(nullable=true)

有一个真正简单的解决方案:

for name in df.schema.names:
  df = df.withColumnRenamed(name, name.replace(' ', ''))

有一个真正简单的解决方案:

for name in df.schema.names:
  df = df.withColumnRenamed(name, name.replace(' ', ''))

如果要使用带有前缀(或后缀)的相同列名对多个列进行重命名,则此操作应该有效


如果要使用带有前缀(或后缀)的相同列名对多个列进行重命名,则此操作应该有效