刮削<；李>；内容与PHP dom_Php_Html_Dom

刮削<；李>；内容与PHP dom

php html dom

刮削<；李>；内容与PHP dom,php,html,dom,Php,Html,Dom,如何使用PHPDOM屏幕抓取来提取名为在我的某个页面中定位我想获取标记的所有内容，并将其显示为html代码。使用simpleXML和xpath。假设您的HTML全部存储在字符串$HTML中，这可能适合您的需要： // Load your html from a file $html = $file_get_contents("/path/to/page.html"); $xml = simplexml_load_string($html); $li = $xml->xpath("/

如何使用PHPDOM屏幕抓取来提取名为

在我的某个页面中定位

我想获取

标记的所有内容，并将其显示为html代码。

使用simpleXML和xpath。假设您的HTML全部存储在字符串

$HTML

中，这可能适合您的需要：

// Load your html from a file
$html = $file_get_contents("/path/to/page.html");
$xml = simplexml_load_string($html);

$li = $xml->xpath("//li[@style='margin-top:10px]");
echo $li->asXML();

使用simpleXML和xpath。假设您的HTML全部存储在字符串

$HTML

中，这可能适合您的需要：

// Load your html from a file
$html = $file_get_contents("/path/to/page.html");
$xml = simplexml_load_string($html);

$li = $xml->xpath("//li[@style='margin-top:10px]");
echo $li->asXML();

$html=”hello World；
if（preg|u match（'|（.*），$html，$matches））
{
$licontent=$matches[1]；
}
$html='hello World；
if（preg|u match（'|（.*），$html，$matches））
{
$licontent=$matches[1]；
}
我发现使用preg_match足以进行刮削。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析：/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html，只提取其中的某一部分。我发现使用preg_match就足以进行抓取。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析：/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html，只提取其中的某一部分。@Callum-Whyte请参见上面的添加：file\u get\u contents（）
@Callum-Whyte请参见上面的添加：file\u get\u contents（）
这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。