通过PHP解析网页和子页面_Php_Html_Parsing_Web Scraping_Html Table

通过PHP解析网页和子页面

php html parsing web-scraping

通过PHP解析网页和子页面,php,html,parsing,web-scraping,html-table,Php,Html,Parsing,Web Scraping,Html Table,在下面的链接中，我想进入每个子页面，将HTML表解析为一个.HTML文件。此外，例如，如果我单击Accounting子页面，该子页面有多个类列表页面（第1、2、3页等）。我还想解析子页面的所有页面这是父页面：我需要使用网络爬虫吗？在一个.html文件中编译所有子页面的最佳方法是什么？如何编写代码来有效地从列出的所有子页面中刮取所有html表数据？干杯您可以使用来获取页面。然后通过所有你找到的链接，如下面，请检查完整的东西 $html->load($result["body"]); $

在下面的链接中，我想进入每个子页面，将HTML表解析为一个.HTML文件。此外，例如，如果我单击Accounting子页面，该子页面有多个类列表页面（第1、2、3页等）。我还想解析子页面的所有页面

这是父页面：

我需要使用网络爬虫吗？在一个.html文件中编译所有子页面的最佳方法是什么？如何编写代码来有效地从列出的所有子页面中刮取所有html表数据？干杯

您可以使用来获取页面。然后通过所有你找到的链接，如下面，请检查完整的东西

$html->load($result["body"]);
$rows = $html->find("a[href]");
foreach ($rows as $row)
{
  //get the page at $row->href, and so on recursevly
}

不过，如果您喜欢这样做，请确保跟踪您访问的链接，否则您可能会陷入无限循环

只是一个旁注，如果有几百页，这可能不是一个好的解决方案，因为它会很慢