Regex pyspark中列名的字符串操作_Regex_Pyspark_Udf

Regex pyspark中列名的字符串操作

regex pyspark

Regex pyspark中列名的字符串操作,regex,pyspark,udf,Regex,Pyspark,Udf,这篇文章对如何更改列名进行了概述。不过，我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗？例如，join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效例如：根 |--客户端：字符串（nullable=true） |--分支编号：string（nullable=true）有一个真正简单的解决方案： for name in df.schema.names: df = df.withColumnRenamed(name, name.r

这篇文章对如何更改列名进行了概述。

不过，我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗？例如，join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效

例如：根 |--客户端：字符串（nullable=true）

|--分支编号：string（nullable=true）

有一个真正简单的解决方案：

for name in df.schema.names:
  df = df.withColumnRenamed(name, name.replace(' ', ''))

有一个真正简单的解决方案：

for name in df.schema.names:
  df = df.withColumnRenamed(name, name.replace(' ', ''))

如果要使用带有前缀（或后缀）的相同列名对多个列进行重命名，则此操作应该有效