Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/243.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
通过PHP解析网页和子页面_Php_Html_Parsing_Web Scraping_Html Table - Fatal编程技术网

通过PHP解析网页和子页面

通过PHP解析网页和子页面,php,html,parsing,web-scraping,html-table,Php,Html,Parsing,Web Scraping,Html Table,在下面的链接中,我想进入每个子页面,将HTML表解析为一个.HTML文件。此外,例如,如果我单击Accounting子页面,该子页面有多个类列表页面(第1、2、3页等)。我还想解析子页面的所有页面 这是父页面: 我需要使用网络爬虫吗?在一个.html文件中编译所有子页面的最佳方法是什么?如何编写代码来有效地从列出的所有子页面中刮取所有html表数据?干杯 您可以使用来获取页面。然后通过所有你找到的链接,如下面,请检查完整的东西 $html->load($result["body"]); $

在下面的链接中,我想进入每个子页面,将HTML表解析为一个.HTML文件。此外,例如,如果我单击Accounting子页面,该子页面有多个类列表页面(第1、2、3页等)。我还想解析子页面的所有页面

这是父页面:

我需要使用网络爬虫吗?在一个.html文件中编译所有子页面的最佳方法是什么?如何编写代码来有效地从列出的所有子页面中刮取所有html表数据?干杯

您可以使用来获取页面。然后通过所有你找到的链接,如下面,请检查完整的东西

$html->load($result["body"]);
$rows = $html->find("a[href]");
foreach ($rows as $row)
{
  //get the page at $row->href, and so on recursevly
}
不过,如果您喜欢这样做,请确保跟踪您访问的链接,否则您可能会陷入无限循环

只是一个旁注,如果有几百页,这可能不是一个好的解决方案,因为它会很慢