移除&;使用PySpark替换字符

移除&;使用PySpark替换字符,pyspark,apache-spark-sql,databricks,Pyspark,Apache Spark Sql,Databricks,我有一个数据框,希望删除所有的括号并替换为两个连字符 之前: +------------+ | dob_concat| +------------+ |[1983][6][3]| +------------+ 之后: +------------+ | dob_concat | +------------+ | 1983-6-3 | +------------+ 您可以使用regex\u replace内置函数,如下所示 from pyspark.sql import functions

我有一个数据框,希望删除所有的括号并替换为两个连字符

之前:

+------------+
|  dob_concat|
+------------+
|[1983][6][3]|
+------------+
之后:

+------------+
| dob_concat |
+------------+
| 1983-6-3   |
+------------+

您可以使用
regex\u replace
内置函数,如下所示

from pyspark.sql import functions as F
df.withColumn("dob_concat", F.regexp_replace(F.regexp_replace(F.regexp_replace("dob_concat", "\\]\\[", "-"), "\\[", ""), "\\]", "")).show()