为php web爬虫调用库(guzzle)?

为php web爬虫调用库(guzzle)?,php,dom,web-crawler,Php,Dom,Web Crawler,我有一个php网络爬虫来解析上述站点的选择性语句 它工作得很好,但当我添加一个while循环来解析网站的多个页面时,出现了错误,如警告:require_once(github.com/guzzle/guzzle):无法打开流:没有这样的文件或目录 我确实从https://github.com/guzzle/guzzle 但在我的剧本中似乎仍然没有正确地进行识别 我的剧本如下: <?php $i = 1; while(true){ require_once('gi

我有一个php网络爬虫来解析上述站点的选择性语句

它工作得很好,但当我添加一个while循环来解析网站的多个页面时,出现了错误,如
警告:require_once(github.com/guzzle/guzzle):无法打开流:没有这样的文件或目录

我确实从
https://github.com/guzzle/guzzle
但在我的剧本中似乎仍然没有正确地进行识别

我的剧本如下:

<?php
    $i = 1; 
    while(true){ 
    require_once('github.com/guzzle/guzzle');
    $subject = file_get_html('http://www.usmleforum.com/forum/index.php?forum=1&Page='+$i);
    preg_match_all('/<td.+?FootNotes2.+?<a.+?<\/a> - (?P<name>.*?)<\/td>.+?<td.+?FootNotes2.+?(?P<date>\d{2}\/\d{2}\/\d{2} \d{2}:\d{2})/siu', $subject, $matchs); 

    foreach ($matchs['name'] as $v){ 
    echo $v. " "; 
    } 
    foreach ($matchs['date'] as $v){ 
    echo $v. " "; 
    } 
    }
    $i++; 
?>

实际上应该返回的是打印站点中所有页面的标记为名称、文本为日期的文本


感谢您的帮助。

请尝试重命名您的文件夹,或将文件置于最短路径。而且
require\u once()
是要求文件而不是文件夹

我应该给文件夹取什么名字?就像你想要的,但是require\u once只用于文件(),实际上我没有
require\u once或guzzle
就使用了相同的代码,而且
while loop
,效果很好。。但后来我添加了while循环以从所有页面获取数据,然后它显示了一个错误,所以一位朋友建议添加这个guzzle。。我对这很陌生?\@请帮我写一行。。我应该从github guzzle下载文件还是不应该?也许你应该为你的while循环增加限制,因为她永远都在运行。如果你想用Guzzle,有医生帮你()