刮削<;李>;内容与PHP dom

刮削<;李>;内容与PHP dom,php,html,dom,Php,Html,Dom,如何使用PHPDOM屏幕抓取来提取名为 在我的某个页面中定位 我想获取标记的所有内容,并将其显示为html代码。使用simpleXML和xpath。假设您的HTML全部存储在字符串$HTML中,这可能适合您的需要: // Load your html from a file $html = $file_get_contents("/path/to/page.html"); $xml = simplexml_load_string($html); $li = $xml->xpath("/

如何使用PHPDOM屏幕抓取来提取名为

  • 在我的某个页面中定位


    我想获取
  • 标记的所有内容,并将其显示为html代码。

    使用simpleXML和xpath。假设您的HTML全部存储在字符串
    $HTML
    中,这可能适合您的需要:

    // Load your html from a file
    $html = $file_get_contents("/path/to/page.html");
    $xml = simplexml_load_string($html);
    
    $li = $xml->xpath("//li[@style='margin-top:10px]");
    echo $li->asXML();
    

    使用simpleXML和xpath。假设您的HTML全部存储在字符串
    $HTML
    中,这可能适合您的需要:

    // Load your html from a file
    $html = $file_get_contents("/path/to/page.html");
    $xml = simplexml_load_string($html);
    
    $li = $xml->xpath("//li[@style='margin-top:10px]");
    echo $li->asXML();
    
    $html=”
  • hello World
  • ; if(preg|u match('|
  • (.*),$html,$matches)) { $licontent=$matches[1]; }
    $html='
  • hello World
  • ; if(preg|u match('|
  • (.*),$html,$matches)) { $licontent=$matches[1]; }
  • 我发现使用preg_match足以进行刮削。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析:/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html,只提取其中的某一部分。我发现使用preg_match就足以进行抓取。而且html不必是格式良好的xml。@Gerben:请。。永远不要建议再次使用正则表达式进行html解析:/LOL正则表达式执行机构这次只在一分钟内到达。@ThiefMaster他不想解析html,只提取其中的某一部分。@Callum-Whyte请参见上面的添加:
    file\u get\u contents()
    @Callum-Whyte请参见上面的添加:
    file\u get\u contents()
    这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。这实际上可以完成手头的工作。只是不要养成使用正则表达式进行更复杂解析的习惯。