Php 为什么simplehtmldom会毫无错误地将我踢出循环?
我在simplehtmldom上遇到了问题,我一直跟踪到这个代码块。我有大约70个不同的网址,我正试图刮,但我的循环只有通过两个。在第二次迭代中,文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面,然后它将把我从两个循环中踢出,而不会命中最后一个打印。最奇怪的是,它没有给出警告或错误Php 为什么simplehtmldom会毫无错误地将我踢出循环?,php,web-scraping,simple-html-dom,Php,Web Scraping,Simple Html Dom,我在simplehtmldom上遇到了问题,我一直跟踪到这个代码块。我有大约70个不同的网址,我正试图刮,但我的循环只有通过两个。在第二次迭代中,文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面,然后它将把我从两个循环中踢出,而不会命中最后一个打印。最奇怪的是,它没有给出警告或错误 foreach($urls as $url) { $html = file_get_html( $url
foreach($urls as $url)
{
$html = file_get_html( $url );
$appList = $html->find("loc");
foreach($appList as $each)
{
print "$each \n";
}
print "hello\n";
}
请不要给出忽略第二个$url并继续下一次迭代的答案。我需要每页上的所有信息我使用普通正则表达式和curl解决了这个问题。这是一个xml页面,所以
preg_match_all("@<loc.*?\/loc>@",$curlHTML,$locTags)
工作正常,但我从来没有弄清楚simple_html_dom发生了什么事您的代码很好,AFAICT。也许这是一个特定于URL的问题?如果我可以问的话,你想解析哪个URL?我不想给出URL,但正是它给了我一个问题外部循环通过第1-77页你是否打开了错误报告?什么是报告?我如何打开它?我假设这会给我一个看不见的错误,如果你从url3开始,它会做同样的事情,然后在url4中死去吗?可能会提供有趣的信息来确定是程序还是URL造成的。。。