PHP简单HTML DOM解析器:如何删除<;字体>;脚本输出中的标记?

PHP简单HTML DOM解析器:如何删除<;字体>;脚本输出中的标记?,php,parsing,dom,tags,Php,Parsing,Dom,Tags,我使用从页面中提取URL列表,如下所示: <?php include('simple_html_dom.php'); $url = 'http://www.domain.com/'; $html = file_get_html($url); foreach($html->find('table[width=370]') as $table) { foreach($table->find('a') as $item) echo $item->

我使用从页面中提取URL列表,如下所示:

<?php
include('simple_html_dom.php');
$url = 'http://www.domain.com/';
$html = file_get_html($url);
foreach($html->find('table[width=370]') as $table)
    {
    foreach($table->find('a') as $item)
        echo $item->outertext . '<br><hr>';
    }
$html->clear();
?>

就提取所需信息而言,它工作得很好,然而,一些标签(在domain.com上)的格式如下:

<a href="http://www.domain.com"><font size="2">Anchor text</font></a>

然而,在其他情况下,字体大小在包含每个a标记的p标记中定义,这意味着a标记显示为:

<a href="http://www.domain.com">Anchor text</a>

有没有办法从那些有字体标签的a标签中去掉字体标签?这可能很简单,但多年来我一直在“环跑”试图做到这一点:(

谢谢你的任何想法或建议

汤姆。

也许吧

如果您只想允许
a
标记,只需使用:

echo strip_tags($item->outertext, 'a');
也许吧

如果您只想允许
a
标记,只需使用:

echo strip_tags($item->outertext, 'a');

啊,是的,谢谢你!我知道这很简单:)我把它修改成:
echo strip\u tags($item->outertext,)。'

',工作得很好。啊,是的,谢谢你!我知道这很简单:)我把它修改成:
echo strip\u标签($item->outertext,“)。”

',它工作得很好。