读取外部HTML源代码并在标记之间列出代码的PHP脚本

读取外部HTML源代码并在标记之间列出代码的PHP脚本,php,html-parsing,Php,Html Parsing,基本上,我想编写php代码,列出外部url中标记之间的所有内容 我不想要第一个,而是所有的。因此,如果外部网站的来源是 <html> <title></title> <head></head> <h1>Test Here</h1> <h1>Test here</h1> </html> 我对PHP很熟悉,但我想不出能做到这一点的脚本。是你的朋友 $dom = f

基本上,我想编写php代码,列出外部url中
标记之间的所有内容

我不想要第一个,而是所有的。因此,如果外部网站的来源是

<html>
  <title></title>
  <head></head>
  <h1>Test Here</h1>
  <h1>Test here</h1>
</html>
我对PHP很熟悉,但我想不出能做到这一点的脚本。

是你的朋友

$dom = file_get_html("http://yourserver.com/path/to/file.html");
// alternatively use str_get_html($html) if you have the html string already...

foreach ($dom->find("h1") as $node)
{
    echo $node->innertext;
}

它非常强大,可以做很多很多事情。

是的,我还建议使用simple\u html\u dom,因为编写正则表达式更复杂
$dom = file_get_html("http://yourserver.com/path/to/file.html");
// alternatively use str_get_html($html) if you have the html string already...

foreach ($dom->find("h1") as $node)
{
    echo $node->innertext;
}