如何在Python中从混合字符串中删除单个字符_Python_Optimization_Replace

如何在Python中从混合字符串中删除单个字符

python optimization replace

如何在Python中从混合字符串中删除单个字符,python,optimization,replace,Python,Optimization,Replace,我有一个表（请参考图片），在这个表中，我想从每一行中删除“A”字符，我在Python中该怎么做下面是我使用regexe\u replace的代码，但是代码没有优化，我想要优化的代码 def re(s): return regexp_replace(s, "A", "").cast("Integer") finalDF = finalD.select(re(col("C0")).alias("C0"),col("C1"),

我有一个表（请参考图片），在这个表中，我想从每一行中删除“A”字符，我在Python中该怎么做

下面是我使用

regexe\u replace

的代码，但是代码没有优化，我想要优化的代码

 def re(s):
      return regexp_replace(s, "A", "").cast("Integer")

    finalDF = finalD.select(re(col("C0")).alias("C0"),col("C1"),
                        re(col("C2")).alias("C2"),
                        re(col("C3")).alias("C3"),col("C4"),
                        re(col("C5")).alias("C5"),
                        re(col("C6")).alias("C6"),col("C7"),
                        re(col("C8")).alias("C8"),
                        re(col("C9")).alias("C9"),col("C10"),
                        re(col("C11")).alias("C11"),col("C12"),
                        re(col("C13")).alias("C13"),
                        re(col("C14")).alias("C14"),col("C15"),
                        re(col("C16")).alias("16"),col("C17"),
                        re(col("C18")).alias("18"),
                        re(col("C19")).alias("C19"),col("Label"))
    finalDF.show(2)

提前谢谢。

为什么要使用正则表达式？正则表达式将是致命的

如果您有给定格式的数据，则使用以下替换函数：

master.csv的内容：

A11| 6|A34|A43|
A11| 6|A35|A44|

with open('master.csv','r') as fh:
    for line in fh.readlines():
        print "Before - ",line
        line = line.replace('A','')
        print "After - ", line
        print "---------------------------"

C:\Users\dinesh_pundkar\Desktop>python c.py
Before remove...
A11| 6|A34|A43|
A11| 6|A35|A44|
After remove ...
11| 6|34|43|
11| 6|35|44|

C:\Users\dinesh_pundkar\Desktop>

代码：

A11| 6|A34|A43|
A11| 6|A35|A44|

with open('master.csv','r') as fh:
    for line in fh.readlines():
        print "Before - ",line
        line = line.replace('A','')
        print "After - ", line
        print "---------------------------"

C:\Users\dinesh_pundkar\Desktop>python c.py
Before remove...
A11| 6|A34|A43|
A11| 6|A35|A44|
After remove ...
11| 6|34|43|
11| 6|35|44|

C:\Users\dinesh_pundkar\Desktop>

输出：

C:\Users\dinesh_pundkar\Desktop>python c.py
Before -  A11| 6|A34|A43|
After -  11| 6|34|43|
---------------------------
Before -  A11| 6|A35|A44|
After -  11| 6|35|44|
---------------------------

一次从完整数据中替换“A”的代码（不逐行进行）

输出：

A11| 6|A34|A43|
A11| 6|A35|A44|

with open('master.csv','r') as fh:
    for line in fh.readlines():
        print "Before - ",line
        line = line.replace('A','')
        print "After - ", line
        print "---------------------------"

C:\Users\dinesh_pundkar\Desktop>python c.py
Before remove...
A11| 6|A34|A43|
A11| 6|A35|A44|
After remove ...
11| 6|34|43|
11| 6|35|44|

C:\Users\dinesh_pundkar\Desktop>

如果我是你，我不会定义

re

函数。它将与名称冲突。您能否提供更多的细节，例如，您的输入数据来自哪里？这是数据库里的吗？哪里定义了

regexp\u replace

？理想情况下，你能给出一个我们能理解的完整程序吗？