python网页抓取-高尔夫障碍_Python_Web Scraping

python网页抓取-高尔夫障碍

python web-scraping

python网页抓取-高尔夫障碍,python,web-scraping,Python,Web Scraping,我是一个初学者，所以我认为这应该是一个简单的问题，然而，翻阅了bs4文档后，我正在努力寻找解决方案如果你对高尔夫有任何了解，这可能有助于回答这个问题我正试图提取这一页上橙色大框中的障碍号码。目前的数字是14.3，尽管这有所改变我的节目 import requests, bs4 res = requests.get('http://www.golf.org.au/Handicap/3012801370') res.raise_for_status() gethcp = bs4.Beautif

我是一个初学者，所以我认为这应该是一个简单的问题，然而，翻阅了bs4文档后，我正在努力寻找解决方案

如果你对高尔夫有任何了解，这可能有助于回答这个问题

我正试图提取这一页上橙色大框中的障碍号码。目前的数字是14.3，尽管这有所改变

我的节目

import requests, bs4
res = requests.get('http://www.golf.org.au/Handicap/3012801370')
res.raise_for_status()
gethcp = bs4.BeautifulSoup(res.text, "lxml")
hcp = gethcp.select('#ctl11_lblExactHandicap')
type(hcp)
hcp[0].getText()

我猜我在这一部分做错了什么。。（决议案文，…）

非常感谢您的指导

您的代码很好。问题是您被重定向到此页面

您需要选择“跳过以查看您的残障历史记录>>”。您可以使用

Selenium

，或添加会话cookie，但在这种情况下，可以通过使用跳过选项的

href

来完成。这样看起来：

import requests, bs4

# Changed URL
res = requests.get('http://www.golf.org.au/handicap-interstitial/3012801370/Skip')

res.raise_for_status()
gethcp = bs4.BeautifulSoup(res.text, "lxml")
hcp = gethcp.select('#ctl11_lblExactHandicap')
type(hcp)
hcp[0].getText()

这将为您提供“14.3”的预期输出。

我在该链接的HTML中的任何地方都没有看到字符串

ExactDisability

（我也没有看到任何大橙色）。它大概是在加载HTML后由JavaScript创建的。如果是这样，您必须先弄清楚该内容来自何处，或者是如何创建的，然后才能将其删除。