Python Web Scraper-访问Web数据时出现问题[PHP错误]_Python_Php_Web Scraping

Python Web Scraper-访问Web数据时出现问题[PHP错误]

python php web-scraping

Python Web Scraper-访问Web数据时出现问题[PHP错误],python,php,web-scraping,Python,Php,Web Scraping,我正试图从网站上刮取所有网站我将使用而不是真正的领域只是为了简化我的问题基本上，有一个大约30万个站点的列表，每个页面有30个结果，所以应该有大约10000个页面这是一个例子： ->从1到30个站点 ->30-60个站点 ->60-90个站点 ->从90到120的站点问题是，当我到达第167页时，没有更多的结果显示出来。这样，我只能看到前5000个站点的列表当我写这篇文章时：我得到这个错误：PHP警告–yii\base\ErrorException 单击以查看完整错误我能够用py

我正试图从网站上刮取所有网站

我将使用而不是真正的领域只是为了简化我的问题

基本上，有一个大约30万个站点的列表，每个页面有30个结果，所以应该有大约10000个页面

这是一个例子：

->从1到30个站点

->30-60个站点

->60-90个站点

->从90到120的站点

问题是，当我到达第167页时，没有更多的结果显示出来。这样，我只能看到前5000个站点的列表

当我写这篇文章时：

我得到这个错误：PHP警告–yii\base\ErrorException

单击以查看完整错误

我能够用python创建一个脚本，它将抓取前5000个站点，但我不知道如何访问完整的列表

例如，可以在该页面上搜索某些关键字，但同样，如果搜索结果超过5000个，则只会显示前5000个站点

关于如何解决这个问题有什么想法吗？

不会显示超过167页的内容。你怎么知道目标网站实际上有307547条记录？可能是编出来的，不是编出来的。我对两个不同的关键词进行了两次搜索，例如“男人”和“女人”，每个关键词都有15k+的搜索结果。我为每个关键词搜索了前5k个站点，并对它们进行了比较，所有的站点都是唯一的。没有重复的。我确信实际上有307547条记录，但我不知道如何访问它。除非你找到这个网站似乎不使用的内部api，否则你可以尝试获得更多的结果。如果所有者为一个类别设置了5000个结果的结果限制，那么您将无法克服它。下次尝试在错误中添加更多代码时，您的答案是错误的。在/mnt/htdocs/myyii2/controllers/SiteController.php中发生异常，因为$res没有键名“matches”。可以在foreach解决您的问题之前添加if语句。请查看以下内容：