Python 正则表达式查找引号内的所有p标记,不包含其他文本

Python 正则表达式查找引号内的所有p标记,不包含其他文本,python,regex,text-parsing,Python,Regex,Text Parsing,我正试图编辑一本翻译得很差的书 我有很多不必要的p标签在它的文本。我想找到引号内的所有p标记,如本文所示: “…嗯。是…真的是…?”并删除那些p标签 我设法想出了一个正则表达式来找到这样的句子(\“**\”),但我无法想象一个正则表达式只选择内引号而不选择其他文本,这样我就可以在一次单击中全部替换它们 请派人来帮忙 edit1:将所有单词“括号”改为“引号”。(?“括号内”,您的示例似乎表明您的意思是“双引号内”?是的,我的意思是“引号内”。我的错。这比看起来更复杂。您正在删除end标记,但如

我正试图编辑一本翻译得很差的书

我有很多不必要的p标签在它的文本。我想找到引号内的所有p标记,如本文所示:
“…嗯。

是…真的是…?”
并删除那些p标签

我设法想出了一个正则表达式来找到这样的句子(
\“*

*\”
),但我无法想象一个正则表达式只选择

内引号而不选择其他文本,这样我就可以在一次单击中全部替换它们

请派人来帮忙


edit1:将所有单词“括号”改为“引号”。

(?“括号内”,您的示例似乎表明您的意思是“双引号内”?是的,我的意思是“引号内”。我的错。这比看起来更复杂。您正在删除end

标记,但如果不删除相应的start标记,您将以无效的HTML结束。有时这并不重要,但可能会弄乱格式。您可能可以使用lookaheads和lookbehinds一步完成这项操作,但我可能只需在n两步。首先找到引号,然后删除p作为第二步。这回答了你的问题吗?它可以按照我的要求工作,但你能让它也多行吗?(有些地方没有编辑)
(?<=\“(.|\n)*)(<\/p>)(?=(.|\n)*\”)