Python:修改内容后写入文件
我只想删除HTML标记,然后在同一个文件中重新保存文件。。 文本文件具有html标记Python:修改内容后写入文件,python,nltk,Python,Nltk,我只想删除HTML标记,然后在同一个文件中重新保存文件。。 文本文件具有html标记 import shutil import os import nltk low_firm=['C:/a1.txt','C:/a2.txt'] for aa in low_firm: f= open (aa,'r+') for bb in f: raw = nltk.clean_html(bb) raw2=str(raw) f.write(low
import shutil
import os
import nltk
low_firm=['C:/a1.txt','C:/a2.txt']
for aa in low_firm:
f= open (aa,'r+')
for bb in f:
raw = nltk.clean_html(bb)
raw2=str(raw)
f.write(low_firm)
但它不起作用!我收到一条消息
IOError: [Errno 0] Error
我会打开一个要读取的文件,以列表中的行形式读取其所有内容,关闭该文件,然后重新打开以在其上写入:
for aa in all_firm:
r = open (aa,'r+')
lines = r.readlines()
r.close()
w = open (aa,'w')
for bb in lines:
raw = nltk.clean_html(bb)
raw2=str(raw)
w.write(low_firm)
这是因为我觉得当包含文本(而不是寄存器或其他二进制数据)时,重写整个文件更容易。几乎总是在文本文件上进行操作不会太慢,因为文本文件没有数据库文件那么大。对您来说,这可能不是更好的解决方案,但我还是建议您尝试一下。您的文件列表称为
low\u firm
,但您正在迭代all\u firm
您还应该在完成写入后关闭文件。您的文件列表称为
low\u firm
,但您正在迭代all\u firm
您是正确的!谢谢!:)