Python 正则表达式查找引号内的所有p标记，不包含其他文本_Python_Regex_Text Parsing

Python 正则表达式查找引号内的所有p标记，不包含其他文本

python regex

Python 正则表达式查找引号内的所有p标记，不包含其他文本,python,regex,text-parsing,Python,Regex,Text Parsing,我正试图编辑一本翻译得很差的书我有很多不必要的p标签在它的文本。我想找到引号内的所有p标记，如本文所示： “…嗯。是…真的是…？”并删除那些p标签我设法想出了一个正则表达式来找到这样的句子（\“**\”），但我无法想象一个正则表达式只选择内引号而不选择其他文本，这样我就可以在一次单击中全部替换它们请派人来帮忙 edit1:将所有单词“括号”改为“引号”。（？“括号内”，您的示例似乎表明您的意思是“双引号内”？是的，我的意思是“引号内”。我的错。这比看起来更复杂。您正在删除end标记，但如

我正试图编辑一本翻译得很差的书

我有很多不必要的p标签在它的文本。我想找到引号内的所有p标记，如本文所示：

“…嗯。
是…真的是…？”

并删除那些p标签

我设法想出了一个正则表达式来找到这样的句子（

\“*
*\”

），但我无法想象一个正则表达式只选择

内引号而不选择其他文本，这样我就可以在一次单击中全部替换它们

请派人来帮忙

edit1:将所有单词“括号”改为“引号”。

（？“括号内”，您的示例似乎表明您的意思是“双引号内”？是的，我的意思是“引号内”。我的错。这比看起来更复杂。您正在删除end标记，但如果不删除相应的start标记，您将以无效的HTML结束。有时这并不重要，但可能会弄乱格式。您可能可以使用lookaheads和lookbehinds一步完成这项操作，但我可能只需在n两步。首先找到引号，然后删除p作为第二步。这回答了你的问题吗？它可以按照我的要求工作，但你能让它也多行吗？（有些地方没有编辑）
(?<=\“(.|\n)*)(<\/p>)(?=(.|\n)*\”)