Regex pyspark中列名的字符串操作
这篇文章对如何更改列名进行了概述。 不过,我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗?例如,join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效 例如: 根 |--客户端:字符串(nullable=true)Regex pyspark中列名的字符串操作,regex,pyspark,udf,Regex,Pyspark,Udf,这篇文章对如何更改列名进行了概述。 不过,我需要做一些我不能做的调整。有人能帮我删除所有colname中的空格吗?例如,join命令和系统化方法减少了处理30列的工作量。我认为正则表达式和自定义项的组合最有效 例如: 根 |--客户端:字符串(nullable=true) |--分支编号:string(nullable=true)有一个真正简单的解决方案: for name in df.schema.names: df = df.withColumnRenamed(name, name.r
|--分支编号:string(nullable=true)有一个真正简单的解决方案:
for name in df.schema.names:
df = df.withColumnRenamed(name, name.replace(' ', ''))
有一个真正简单的解决方案:
for name in df.schema.names:
df = df.withColumnRenamed(name, name.replace(' ', ''))
如果要使用带有前缀(或后缀)的相同列名对多个列进行重命名,则此操作应该有效
如果要使用带有前缀(或后缀)的相同列名对多个列进行重命名,则此操作应该有效