使用python删除文本块

使用python删除文本块,python,Python,我正在尝试使用python从文件中删除大块文本。每个文本块都以 /translation=“SOMETEXT” 以第二句话结尾 有谁能给我一些关于如何做到这一点的建议吗 谢谢如果性能不重要,您可以这样做。正则表达式可能会更快,但这更简单 def remtxt(s,startstr,endstr): while startstr in s: startpos=s.index(startstr) try:

我正在尝试使用python从文件中删除大块文本。每个文本块都以

/translation=“SOMETEXT”

以第二句话结尾

有谁能给我一些关于如何做到这一点的建议吗


谢谢

如果性能不重要,您可以这样做。正则表达式可能会更快,但这更简单

def remtxt(s,startstr,endstr):
        while startstr in s:
                startpos=s.index(startstr)
                try:
                        endpos=s.index(endstr,startpos+len(startstr))+len(endstr)
                except:
                        return
                s=s[:startpos]+s[endpos:]
        return s

new_string=remtxt(my_string,'/translation="','"')

您可以这样使用re.sub:

import re
re.sub("/translation=\".*?\" ", "", s)

使用正则表达式。我不太喜欢这些,但这只是一个正确方向的提示。尝试re模块,使用一些regex测试工具,它将使测试更容易()。