Regex 在python重新打包中使用正则表达式操作标记
输入文本文件包含:Regex 在python重新打包中使用正则表达式操作标记,regex,python-3.x,tags,Regex,Python 3.x,Tags,输入文本文件包含: 这是一个标题 这是一个div这是一个嵌套的div 我想将以下内容输出到另一个文本文件: 这是一个标题 这是一个div这是一个嵌套的div 在python中使用正则表达式如何做到这一点? 更新!!!! 我试过这样做: 重新导入 def run(): 将open('input.txt')作为f: fout=open('output.txt','w') 计数=0 对于f中的行: 如果不是直线: 持续 pat=关于findall(“”,第行) 对于帕特的l: y=re.sub
这是一个标题
这是一个div这是一个嵌套的div
我想将以下内容输出到另一个文本文件:
这是一个标题
这是一个div这是一个嵌套的div
在python中使用正则表达式如何做到这一点?
更新!!!!
我试过这样做:
重新导入
def run():
将open('input.txt')作为f:
fout=open('output.txt','w')
计数=0
对于f中的行:
如果不是直线:
持续
pat=关于findall(“”,第行)
对于帕特的l:
y=re.sub(“”,,.format(l[-2]),行,计数=0,标志=0)
第四次写入(y)
我希望现在提供一个可能的解决方案还不算太晚。这是我的密码:
import re
def run():
f = """<html>
<tag>bruh</tag>
<a><bro>text here</bro></a>
</html>
"""
g = ""
while g != f:
g = f
f = re.sub(r'<(.+?)(\w)>([\w\W\n\r]*)</\1\2>', r'<\2>\3</\2>', f)
print(f)
run()
重新导入
def run():
f=”“”
布鲁
此处文本
"""
g=“”
而g!=f:
g=f
f=re.sub(r'([\w\w\n\r]*),r'\3',f)
印刷品(f)
运行()
输出:
<l>
<r>
<e>This is a title</e>
</r>
<y>
<v>This is a div <v>This is a nested div</v></v>
</y>
</l>
这是一个标题
这是一个div这是一个嵌套的div
我一直使用相同的替换函数,直到没有更多的替换可用,g!=f
。i、 e.直到替换文本与正文相同
注意:我主要是一名Java用户,在过去可能使用过5次Python。这不是为(很可能)错误答案辩护的借口,但作为一个警告,在我不知道的特定情况下,可能会有一些错误。到目前为止,你尝试过什么吗?@SulemanElahi是的,我尝试过,但我只能让它对其中一个有效,但不能both@jonrsharpe实际上,这是一个文本文档,这个问题是在一次竞赛中提出的。这是一个包含HTML的文本文件,请看它。