Python 如何使用无限自动滚动抓取页面?

Python 如何使用无限自动滚动抓取页面?,python,web-crawler,autoscroll,Python,Web Crawler,Autoscroll,我想在自动下一页滚动的页面中抓取用户名(向下滚动时,它会显示更多结果)。假设我想把所有的用户名都记下来。知道怎么做吗?当您滚动到该页面的末尾时,会向url发出ajax请求,如: 您需要了解它是如何生成该url的,并在那里发出请求,然后对其进行解析。如果您使用Chrome浏览器,请查看webinspector中的“网络”选项卡以查看该站点发出的请求。因此,如果我在python中发出urlopen请求,我将进入下一页?当我打开时,我会看到一条类似“({“messages”:[“require.en

我想在自动下一页滚动的页面中抓取用户名(向下滚动时,它会显示更多结果)。假设我想把所有的用户名都记下来。知道怎么做吗?

当您滚动到该页面的末尾时,会向url发出ajax请求,如:


您需要了解它是如何生成该url的,并在那里发出请求,然后对其进行解析。

如果您使用Chrome浏览器,请查看webinspector中的“网络”选项卡以查看该站点发出的请求。因此,如果我在python中发出urlopen请求,我将进入下一页?当我打开时,我会看到一条类似“({“messages”:[“require.enqueue(function(require){require(\“w2.livenode\”))。ReportPageNeedsLoad(\“lost\u group\”)”),“min\u seq”:28309793}”的消息,这将需要您做一些工作,您需要了解站点如何在JavaScript中生成这些URL,然后在python中使用该逻辑来检索列表,最后需要了解如何解析响应。