Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 在python重新打包中使用正则表达式操作标记_Regex_Python 3.x_Tags - Fatal编程技术网

Regex 在python重新打包中使用正则表达式操作标记

Regex 在python重新打包中使用正则表达式操作标记,regex,python-3.x,tags,Regex,Python 3.x,Tags,输入文本文件包含: 这是一个标题 这是一个div这是一个嵌套的div 我想将以下内容输出到另一个文本文件: 这是一个标题 这是一个div这是一个嵌套的div 在python中使用正则表达式如何做到这一点? 更新!!!! 我试过这样做: 重新导入 def run(): 将open('input.txt')作为f: fout=open('output.txt','w') 计数=0 对于f中的行: 如果不是直线: 持续 pat=关于findall(“”,第行) 对于帕特的l: y=re.sub

输入文本文件包含:


这是一个标题
这是一个div这是一个嵌套的div
我想将以下内容输出到另一个文本文件:


这是一个标题
这是一个div这是一个嵌套的div
在python中使用正则表达式如何做到这一点? 更新!!!! 我试过这样做:

重新导入
def run():
将open('input.txt')作为f:
fout=open('output.txt','w')
计数=0
对于f中的行:
如果不是直线:
持续
pat=关于findall(“”,第行)
对于帕特的l:
y=re.sub(“”,,.format(l[-2]),行,计数=0,标志=0)
第四次写入(y)

我希望现在提供一个可能的解决方案还不算太晚。这是我的密码:

import re

def run():

    f = """<html>
<tag>bruh</tag>
<a><bro>text here</bro></a>
</html>
"""
    g = ""

    while g != f:
        g = f
        f = re.sub(r'<(.+?)(\w)>([\w\W\n\r]*)</\1\2>', r'<\2>\3</\2>', f)

    print(f)

run()
重新导入
def run():
f=”“”
布鲁
此处文本
"""
g=“”
而g!=f:
g=f
f=re.sub(r'([\w\w\n\r]*),r'\3',f)
印刷品(f)
运行()
输出:

<l>
<r>
<e>This is a title</e>
</r>
<y>
        <v>This is a div <v>This is a nested div</v></v>
</y>
</l>

这是一个标题
这是一个div这是一个嵌套的div
我一直使用相同的替换函数,直到没有更多的替换可用,
g!=f
。i、 e.直到替换文本与正文相同


注意:我主要是一名Java用户,在过去可能使用过5次Python。这不是为(很可能)错误答案辩护的借口,但作为一个警告,在我不知道的特定情况下,可能会有一些错误。

到目前为止,你尝试过什么吗?@SulemanElahi是的,我尝试过,但我只能让它对其中一个有效,但不能both@jonrsharpe实际上,这是一个文本文档,这个问题是在一次竞赛中提出的。这是一个包含HTML的文本文件,请看它。