需要脱衣<;a>;来自<;img>;标记,但留下其他<;a>;标记未受损(使用PHP)
我正在为一个客户端构建一个RSS提要,他们要求标记不能嵌入到锚标记中 样本如下:需要脱衣<;a>;来自<;img>;标记,但留下其他<;a>;标记未受损(使用PHP),php,rss,image,Php,Rss,Image,我正在为一个客户端构建一个RSS提要,他们要求标记不能嵌入到锚标记中 样本如下: <a href="http://www.xxxx.us/wp-content/uploads/2012/09/image47.png"> <img style="background-image: none; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; padding-top: 0px; b
<a href="http://www.xxxx.us/wp-content/uploads/2012/09/image47.png">
<img style="background-image: none; margin: 0px; padding-left: 0px; padding-right: 0px; display: inline; padding-top: 0px; border: 0px;" title="image" src="http://www.xxxx.us/wp-content/uploads/2012/09/image_thumb46.png" alt="image" width="244" height="175" border="0" />
</a>
我不能使用$content=stip_标记($content);由于这将剥离所有锚定标记剥离_标记(),因此它能够允许未剥离的标记
请参见下面的示例
<?php
$text = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
// Allow <p> and <a>
echo strip_tags($text, '<p><a>');
?>
使用DOM。一些xpath来查找所有
的子类
,一些树操作来删除
,您就完成了。我正在尝试一种正则表达式php解决问题的方法,不要使用正则表达式来处理html。这是一个自动百万票否决在这个网站上。你会花80%的时间让regex正常工作,19%的时间剪头发,还有1%的时间打自杀热线。是的,但我需要保留“一些”标签,只需删除图像周围的标签。