Python-从csv文件中消除正则表达式匹配

Python-从csv文件中消除正则表达式匹配,python,regex,csv,Python,Regex,Csv,我有一个文件,'in.csv',其中有许多条目,如下所示: [Part 1: A] Was hab’ ich nur getan? Hab mich selbst nie hinterfragt Wer bin ich, wer bin ich, wer bin ich, was bin ich bloß? Aaaah - wer bin ich, was bin ich bloß? Ging es all die Zeit lang wirklich nur um mich? Nur um m

我有一个文件,
'in.csv'
,其中有许多条目,如下所示:

[Part 1: A]
Was hab’ ich nur getan?
Hab mich selbst nie hinterfragt
Wer bin ich, wer bin ich, wer bin ich, was bin ich bloß?
Aaaah - wer bin ich, was bin ich bloß?
Ging es all die Zeit lang wirklich nur um mich?
Nur um mich, nur um mich, nur um mich?
Denk’ ich wirklich immer nur an mich?
Nur an mich, nur an mich, nur an mich?

[Part 2: T]
Ich bin so horrible, horrible, horrible
Fehler einzusehen ist mir nicht possible, possible, possible
Jaaah - doch ich denk’ jeden Tag an all den Shit, den ich getan hab’
Warum unterschätz’ ich meinen Impact auf die andern?
Homie, sag mir, warum ficke ich mein Karma
Und geb kein’ Fick auf alles, was die Stimme in mir labert?
Blockiert mich da mein Ego oder weiß ich es nicht besser?
Mann, wann verdammt fühl ich mich bereit etwas zu ändern?
Warum lass’ ich einfach nichts mehr an mich ran?
Warum lass’ ich selbst mich selbst nicht an mich ran?
,1

(...)
我想找到并消除所有出现的这种模式:

match = "[\(\[].*?[\)\]]"
我正在尝试这个:

with open('in.csv', 'rb') as in_file, open('out.csv', 'wb') as out_file:
     reader = csv.reader(in_file, delimiter='\t')
     for item in list(reader):
         re.sub(match, ' ', item, flags=re.MULTILINE)      
         out_file.write(item)

但它不起作用。如何查找和删除所有
[]

问题是您对结果没有做任何处理,表达式是正确的:

with open('in.csv', 'rb') as in_file, open('out.csv', 'wb') as out_file:
     reader = csv.reader(in_file, delimiter='\t')
     for item in list(reader):
         item = re.sub(match, ' ', item, flags=re.MULTILINE) 
         # ---^---     
         out_file.write(item)
sub
函数不会更改原始字符串,而是会返回一个新的副本,因此您需要捕捉到这一点。您甚至可以通过添加锚来改善您的表达:

^[\(\[].*?[\)\]]

它大大减少了所需的步骤(10倍!),请参阅。

您可以粘贴输出或运行此操作时看到的错误吗?不打印错误。但是,
out\u file
保持不变。将reader(一个iterable)转换为list的目的是什么?只是问一下。因为.csv中的
in
很大,我只想尝试第一项的正则表达式匹配