Php 使用指定属性剥离html标记和内容

Php 使用指定属性剥离html标记和内容,php,html,parsing,Php,Html,Parsing,我有很多这样标记的文本: <span class="section">[<a href="blablabla">Section</a>]</span> [] 我需要删除包含class=“section”的所有内容,包括span标记和其中的文本。我正在寻找一个正则表达式或替代方法来自动化这个任务 有什么线索吗 编辑:我可以做任何有助于我解决这个问题的事情,我认为正则表达式是更简单的方法。我正在用PHP编写代码 谢谢。如果您的节类标记不包含相同类型

我有很多这样标记的文本:

<span class="section">[<a href="blablabla">Section</a>]</span>
[]
我需要删除包含class=“section”的所有内容,包括span标记和其中的文本。我正在寻找一个正则表达式或替代方法来自动化这个任务

有什么线索吗

编辑:我可以做任何有助于我解决这个问题的事情,我认为正则表达式是更简单的方法。我正在用PHP编写代码


谢谢。

如果您的节类标记不包含相同类型的元素(例如,您没有包含跨距的跨距),则可以使用正则表达式轻松完成此操作

以下是最简单的:

$stripped = preg_replace('@<span class="section">.*?</span>@', '', $input);
$stripped=preg_replace('@.*?@',''.$input);
如果需要,它允许任何标记、任何其他属性和任何其他类:

$stripped = preg_replace('@<(\w+)[^>]*class="[^"]*section[^"]*"[^>]*>.*?</\1>@', '', $input);
$stripped=preg_replace('@]*class=“[^”]*节[^”]*“[^>]*>.*?@','''.$input);

与愚蠢的非答案相反,使用正则表达式是可能的,只是不容易。更简单的是,它允许:
printHTMLQP($html)->remove(“.section”)->top()->html()