Php 为什么simplehtmldom会毫无错误地将我踢出循环？_Php_Web Scraping_Simple Html Dom

Php 为什么simplehtmldom会毫无错误地将我踢出循环？

php web-scraping

Php 为什么simplehtmldom会毫无错误地将我踢出循环？,php,web-scraping,simple-html-dom,Php,Web Scraping,Simple Html Dom,我在simplehtmldom上遇到了问题，我一直跟踪到这个代码块。我有大约70个不同的网址，我正试图刮，但我的循环只有通过两个。在第二次迭代中，文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面，然后它将把我从两个循环中踢出，而不会命中最后一个打印。最奇怪的是，它没有给出警告或错误 foreach($urls as $url) { $html = file_get_html( $url

我在simplehtmldom上遇到了问题，我一直跟踪到这个代码块。我有大约70个不同的网址，我正试图刮，但我的循环只有通过两个。在第二次迭代中，文件_get_html$url只将页面的一部分返回到$html中。嵌入的foreach循环将运行并打印出部分页面，然后它将把我从两个循环中踢出，而不会命中最后一个打印。最奇怪的是，它没有给出警告或错误

foreach($urls as $url)
        {    
            $html = file_get_html( $url );
            $appList = $html->find("loc");
            foreach($appList as $each)
            {
                print "$each \n";
            }
            print "hello\n";

        }

请不要给出忽略第二个$url并继续下一次迭代的答案。我需要每页上的所有信息

我使用普通正则表达式和curl解决了这个问题。这是一个xml页面，所以

preg_match_all("@<loc.*?\/loc>@",$curlHTML,$locTags)

工作正常，但我从来没有弄清楚simple_html_dom发生了什么事

您的代码很好，AFAICT。也许这是一个特定于URL的问题？如果我可以问的话，你想解析哪个URL？我不想给出URL，但正是它给了我一个问题外部循环通过第1-77页你是否打开了错误报告？什么是报告？我如何打开它？我假设这会给我一个看不见的错误，如果你从url3开始，它会做同样的事情，然后在url4中死去吗？可能会提供有趣的信息来确定是程序还是URL造成的。。。