Php 为什么simplehtmldom会毫无错误地将我踢出循环?

Php 为什么simplehtmldom会毫无错误地将我踢出循环?,php,web-scraping,simple-html-dom,Php,Web Scraping,Simple Html Dom,我在simplehtmldom上遇到了问题,我一直跟踪到这个代码块。我有大约70个不同的网址,我正试图刮,但我的循环只有通过两个。在第二次迭代中,文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面,然后它将把我从两个循环中踢出,而不会命中最后一个打印。最奇怪的是,它没有给出警告或错误 foreach($urls as $url) { $html = file_get_html( $url

我在simplehtmldom上遇到了问题,我一直跟踪到这个代码块。我有大约70个不同的网址,我正试图刮,但我的循环只有通过两个。在第二次迭代中,文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面,然后它将把我从两个循环中踢出,而不会命中最后一个打印。最奇怪的是,它没有给出警告或错误

foreach($urls as $url)
        {    
            $html = file_get_html( $url );
            $appList = $html->find("loc");
            foreach($appList as $each)
            {
                print "$each \n";
            }
            print "hello\n";

        }

请不要给出忽略第二个$url并继续下一次迭代的答案。我需要每页上的所有信息

我使用普通正则表达式和curl解决了这个问题。这是一个xml页面,所以

preg_match_all("@<loc.*?\/loc>@",$curlHTML,$locTags)

工作正常,但我从来没有弄清楚simple_html_dom发生了什么事

您的代码很好,AFAICT。也许这是一个特定于URL的问题?如果我可以问的话,你想解析哪个URL?我不想给出URL,但正是它给了我一个问题外部循环通过第1-77页你是否打开了错误报告?什么是报告?我如何打开它?我假设这会给我一个看不见的错误,如果你从url3开始,它会做同样的事情,然后在url4中死去吗?可能会提供有趣的信息来确定是程序还是URL造成的。。。