使用python删除文本块
我正在尝试使用python从文件中删除大块文本。每个文本块都以 /translation=“SOMETEXT” 以第二句话结尾 有谁能给我一些关于如何做到这一点的建议吗使用python删除文本块,python,Python,我正在尝试使用python从文件中删除大块文本。每个文本块都以 /translation=“SOMETEXT” 以第二句话结尾 有谁能给我一些关于如何做到这一点的建议吗 谢谢如果性能不重要,您可以这样做。正则表达式可能会更快,但这更简单 def remtxt(s,startstr,endstr): while startstr in s: startpos=s.index(startstr) try:
谢谢如果性能不重要,您可以这样做。正则表达式可能会更快,但这更简单
def remtxt(s,startstr,endstr):
while startstr in s:
startpos=s.index(startstr)
try:
endpos=s.index(endstr,startpos+len(startstr))+len(endstr)
except:
return
s=s[:startpos]+s[endpos:]
return s
new_string=remtxt(my_string,'/translation="','"')
您可以这样使用re.sub:
import re
re.sub("/translation=\".*?\" ", "", s)
使用正则表达式。我不太喜欢这些,但这只是一个正确方向的提示。尝试re模块,使用一些regex测试工具,它将使测试更容易()。