Python 使用BeautifulSoup进行错误解析
我想访问此网站的标题: 实际上,我使用BeautifulSoup,但是当我使用此代码访问时,结果为空([]): 如果您能修改我的代码或给我另一个可以使用的库,我将非常感谢您的帮助 谢谢大家 编辑:问题是HTML网站没有以下元素:Python 使用BeautifulSoup进行错误解析,python,beautifulsoup,urllib,Python,Beautifulsoup,Urllib,我想访问此网站的标题: 实际上,我使用BeautifulSoup,但是当我使用此代码访问时,结果为空([]): 如果您能修改我的代码或给我另一个可以使用的库,我将非常感谢您的帮助 谢谢大家 编辑:问题是HTML网站没有以下元素: 此网站使用AJAX显示结果,您可以找到AJAX请求以获得JSON结果 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup import json def ge
此网站使用AJAX显示结果,您可以找到AJAX请求以获得JSON结果
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
import json
def generateJson(my_url):
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
return json.loads(page_html.decode("utf-8"))
page_json = generateJson('https://zenodo.org/api/records/?page=1&size=20&q=broma')
print(page_json["hits"]["hits"][0]["metadata"]["title"])
本网站使用AJAX显示结果,您可以找到AJAX请求以获得JSON结果
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
import json
def generateJson(my_url):
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
return json.loads(page_html.decode("utf-8"))
page_json = generateJson('https://zenodo.org/api/records/?page=1&size=20&q=broma')
print(page_json["hits"]["hits"][0]["metadata"]["title"])
打扰一下我忘了说清楚,我需要的是“教育、健康和体育年度报告9781329899971”(实际上是链接,但现在这个标题对我有用)。对不起。我忘了说清楚,我需要的是“教育、健康和体育年度报告9781329899971”(实际上是链接,但现在这个标题对我有用)。谢谢你的回复。问题是,当我想要标题“教育、健康和体育年度报告9781329899971”时,我无法用containers=page_-soup.findAll('div',{'class':'ng-binding')将page_-soup对象打印到控制台,你可以找到没有div的类是ng-binding。非常感谢你。我将尝试获取标题的链接。谢谢您的回复。问题是,当我想要标题“教育、健康和体育年度报告9781329899971”时,我无法用containers=page_-soup.findAll('div',{'class':'ng-binding')将page_-soup对象打印到控制台,你可以找到没有div的类是ng-binding。非常感谢你。我要试着找到这篇文章的链接。