Php 用格式化文本解析HTML

Php 用格式化文本解析HTML,php,html,parsing,domdocument,Php,Html,Parsing,Domdocument,我正在用DOMDocument解析一个HTML网页 这是我的密码: $doc = new DOMDocument(); $doc->strictErrorChecking = false; $input = file_get_contents($url); //Url passato come parametro $doc->loadHTML( $input ); $xpath = new DOMXpath($doc); $article = $xpath->query('//

我正在用DOMDocument解析一个HTML网页

这是我的密码:

$doc = new DOMDocument();
$doc->strictErrorChecking = false;
$input = file_get_contents($url); //Url passato come parametro
$doc->loadHTML( $input );
$xpath = new DOMXpath($doc);
$article = $xpath->query('//div[@class="entry-container fix"]');
在$article中,所有文本都在“entry container fix”Div中

但网页中的此文本具有格式化文本。 简单地扩展示例:

<div> 
   <p> Text <strong> Strong text </strong> </p>
</div>

文本strong文本

在我的代码中,我丢失了所有粗体、意大利语字符和所有段落ecc。。。
有一种方法可以获取所有格式化文本?

为什么不使用saveHTML函数来提取该HTML(以下是链接:)。它看起来像这样:

$sFormated = $doc->saveHTML($article->item(0));

我正在尝试使用它。但它不起作用。你能更好地解释一下如何在我的代码中使用它吗?例如,我尝试过:$doc->saveHTML($article['output']->nodeValue(0));但仍然不起作用。