Web scraping 刮下；“显示更多”；_Web Scraping_Beautifulsoup

Web scraping 刮下；“显示更多”；

web-scraping

Web scraping 刮下；“显示更多”；,web-scraping,beautifulsoup,Web Scraping,Beautifulsoup,我试图用BeautifulSoup从特定站点（Google Scholar）中删除所有具有相同标签的对象，但它不会删除页面末尾“显示更多”下的对象。我怎样才能修好它下面是我的代码示例： # -*- coding: cp1253 -*- from urllib import urlopen from bs4 import BeautifulSoup webpage=urlopen('http://scholar.google.gr/citations?user=FwuKA4UAAAAJ&

我试图用BeautifulSoup从特定站点（Google Scholar）中删除所有具有相同标签的对象，但它不会删除页面末尾“显示更多”下的对象。我怎样才能修好它

下面是我的代码示例：

# -*- coding: cp1253 -*-
from urllib import urlopen
from bs4 import BeautifulSoup
webpage=urlopen('http://scholar.google.gr/citations?user=FwuKA4UAAAAJ&hl=el')
soup=BeautifulSoup(webpage)
for t in soup.findAll('a',{"class":"gsc_a_at"}):
      print t.text

在Chrome中，尝试F12-->网络，选择“保留日志”并禁用缓存。现在点击“显示更多”按钮

检查正在发送的GET/POST请求。您将知道接下来要做什么。

内容可能是由JS生成的，因此您需要运行一个scraper来呈现JS。看一看我的文章，它让你知道如何用JS加载页面。之后，需要运行显示更多内容的函数，然后对结果进行刮取。答案可能会帮助您使用PyQT运行javascript函数。谢谢，但哪个函数显示更多内容？我不知道，您必须检查正在抓取的页面的源代码，并查看当您单击“显示更多”按钮时调用的函数。我阅读了页面的源代码，但没有找到任何标记。这是否意味着页面不使用JS？或者我可以用另一种方法找到它吗？（对不起，我是初学者）