Web scraping 刮下;“显示更多”;

Web scraping 刮下;“显示更多”;,web-scraping,beautifulsoup,Web Scraping,Beautifulsoup,我试图用BeautifulSoup从特定站点(Google Scholar)中删除所有具有相同标签的对象,但它不会删除页面末尾“显示更多”下的对象。我怎样才能修好它 下面是我的代码示例: # -*- coding: cp1253 -*- from urllib import urlopen from bs4 import BeautifulSoup webpage=urlopen('http://scholar.google.gr/citations?user=FwuKA4UAAAAJ&

我试图用BeautifulSoup从特定站点(Google Scholar)中删除所有具有相同标签的对象,但它不会删除页面末尾“显示更多”下的对象。我怎样才能修好它

下面是我的代码示例:

# -*- coding: cp1253 -*-
from urllib import urlopen
from bs4 import BeautifulSoup
webpage=urlopen('http://scholar.google.gr/citations?user=FwuKA4UAAAAJ&hl=el')
soup=BeautifulSoup(webpage)
for t in soup.findAll('a',{"class":"gsc_a_at"}):
      print t.text
在Chrome中,尝试F12-->网络,选择“保留日志”并禁用缓存。 现在点击“显示更多”按钮


检查正在发送的GET/POST请求。您将知道接下来要做什么。

内容可能是由JS生成的,因此您需要运行一个scraper来呈现JS。看一看我的文章,它让你知道如何用JS加载页面。之后,需要运行显示更多内容的函数,然后对结果进行刮取。答案可能会帮助您使用PyQT运行javascript函数。谢谢,但哪个函数显示更多内容?我不知道,您必须检查正在抓取的页面的源代码,并查看当您单击“显示更多”按钮时调用的函数。我阅读了页面的源代码,但没有找到任何标记。这是否意味着页面不使用JS?或者我可以用另一种方法找到它吗?(对不起,我是初学者)