刮削<;李>;内容与PHP dom
如何使用PHPDOM屏幕抓取来提取名为刮削<;李>;内容与PHP dom,php,html,dom,Php,Html,Dom,如何使用PHPDOM屏幕抓取来提取名为 在我的某个页面中定位 我想获取标记的所有内容,并将其显示为html代码。使用simpleXML和xpath。假设您的HTML全部存储在字符串$HTML中,这可能适合您的需要: // Load your html from a file $html = $file_get_contents("/path/to/page.html"); $xml = simplexml_load_string($html); $li = $xml->xpath("/
在我的某个页面中定位
我想获取
标记的所有内容,并将其显示为html代码。使用simpleXML和xpath。假设您的HTML全部存储在字符串$HTML
中,这可能适合您的需要:
// Load your html from a file
$html = $file_get_contents("/path/to/page.html");
$xml = simplexml_load_string($html);
$li = $xml->xpath("//li[@style='margin-top:10px]");
echo $li->asXML();
使用simpleXML和xpath。假设您的HTML全部存储在字符串
$HTML
中,这可能适合您的需要:
// Load your html from a file
$html = $file_get_contents("/path/to/page.html");
$xml = simplexml_load_string($html);
$li = $xml->xpath("//li[@style='margin-top:10px]");
echo $li->asXML();
$html=”hello World ;
if(preg|u match('|(.*),$html,$matches))
{
$licontent=$matches[1];
}
$html='hello World ;
if(preg|u match('|(.*),$html,$matches))
{
$licontent=$matches[1];
}
我发现使用preg_match足以进行刮削。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析:/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html,只提取其中的某一部分。我发现使用preg_match就足以进行抓取。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析:/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html,只提取其中的某一部分。@Callum-Whyte请参见上面的添加:file\u get\u contents()
@Callum-Whyte请参见上面的添加:file\u get\u contents()
这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。