为php web爬虫调用库（guzzle）？_Php_Dom_Web Crawler

为php web爬虫调用库（guzzle）？

php dom web-crawler

为php web爬虫调用库（guzzle）？,php,dom,web-crawler,Php,Dom,Web Crawler,我有一个php网络爬虫来解析上述站点的选择性语句它工作得很好，但当我添加一个while循环来解析网站的多个页面时，出现了错误，如警告：require_once（github.com/guzzle/guzzle）：无法打开流：没有这样的文件或目录我确实从https://github.com/guzzle/guzzle 但在我的剧本中似乎仍然没有正确地进行识别我的剧本如下： <?php $i = 1; while(true){ require_once('gi

我有一个php网络爬虫来解析上述站点的选择性语句

它工作得很好，但当我添加一个while循环来解析网站的多个页面时，出现了错误，如

警告：require_once（github.com/guzzle/guzzle）：无法打开流：没有这样的文件或目录

我确实从

https://github.com/guzzle/guzzle

但在我的剧本中似乎仍然没有正确地进行识别

我的剧本如下：

<?php
    $i = 1; 
    while(true){ 
    require_once('github.com/guzzle/guzzle');
    $subject = file_get_html('http://www.usmleforum.com/forum/index.php?forum=1&Page='+$i);
    preg_match_all('/<td.+?FootNotes2.+?<a.+?<\/a> - (?P<name>.*?)<\/td>.+?<td.+?FootNotes2.+?(?P<date>\d{2}\/\d{2}\/\d{2} \d{2}:\d{2})/siu', $subject, $matchs); 

    foreach ($matchs['name'] as $v){ 
    echo $v. " "; 
    } 
    foreach ($matchs['date'] as $v){ 
    echo $v. " "; 
    } 
    }
    $i++; 
?>

实际上应该返回的是打印站点中所有页面的标记为名称、文本为日期的文本

感谢您的帮助。

请尝试重命名您的文件夹，或将文件置于最短路径。而且

require\u once（）

是要求文件而不是文件夹

我应该给文件夹取什么名字？就像你想要的，但是require\u once只用于文件（），实际上我没有

require\u once或guzzle

就使用了相同的代码，而且

while loop

，效果很好。。但后来我添加了while循环以从所有页面获取数据，然后它显示了一个错误，所以一位朋友建议添加这个guzzle。。我对这很陌生？\@请帮我写一行。。我应该从github guzzle下载文件还是不应该？也许你应该为你的while循环增加限制，因为她永远都在运行。如果你想用Guzzle，有医生帮你（）