python网页抓取-高尔夫障碍

python网页抓取-高尔夫障碍,python,web-scraping,Python,Web Scraping,我是一个初学者,所以我认为这应该是一个简单的问题,然而,翻阅了bs4文档后,我正在努力寻找解决方案 如果你对高尔夫有任何了解,这可能有助于回答这个问题 我正试图提取这一页上橙色大框中的障碍号码。目前的数字是14.3,尽管这有所改变 我的节目 import requests, bs4 res = requests.get('http://www.golf.org.au/Handicap/3012801370') res.raise_for_status() gethcp = bs4.Beautif

我是一个初学者,所以我认为这应该是一个简单的问题,然而,翻阅了bs4文档后,我正在努力寻找解决方案

如果你对高尔夫有任何了解,这可能有助于回答这个问题

我正试图提取这一页上橙色大框中的障碍号码。目前的数字是14.3,尽管这有所改变

我的节目

import requests, bs4
res = requests.get('http://www.golf.org.au/Handicap/3012801370')
res.raise_for_status()
gethcp = bs4.BeautifulSoup(res.text, "lxml")
hcp = gethcp.select('#ctl11_lblExactHandicap')
type(hcp)
hcp[0].getText()
我猜我在这一部分做错了什么。。(决议案文,…)


非常感谢您的指导

您的代码很好。问题是您被重定向到此页面

您需要选择“跳过以查看您的残障历史记录>>”。您可以使用
Selenium
,或添加会话cookie,但在这种情况下,可以通过使用跳过选项的
href
来完成。这样看起来:

import requests, bs4

# Changed URL
res = requests.get('http://www.golf.org.au/handicap-interstitial/3012801370/Skip')

res.raise_for_status()
gethcp = bs4.BeautifulSoup(res.text, "lxml")
hcp = gethcp.select('#ctl11_lblExactHandicap')
type(hcp)
hcp[0].getText()

这将为您提供“14.3”的预期输出。

我在该链接的HTML中的任何地方都没有看到字符串
ExactDisability
(我也没有看到任何大橙色)。它大概是在加载HTML后由JavaScript创建的。如果是这样,您必须先弄清楚该内容来自何处,或者是如何创建的,然后才能将其删除。