Python 刮纸台和罐';找不到源代码
所以我正在浏览这个网站:我无法从第二个表中获得数据。第一队的统计数据在源代码中,而第二队的统计数据不在源代码中Python 刮纸台和罐';找不到源代码,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,所以我正在浏览这个网站:我无法从第二个表中获得数据。第一队的统计数据在源代码中,而第二队的统计数据不在源代码中 如果我右键单击并在浏览器中查看源代码,那么我可以看到两个团队的表,但当我使用BeautifulSoup刮取数据时,表在那里,但里面没有数据。在没有任何代码的情况下帮助您调试代码有点困难;-) 但是,我猜您可能正在使用只返回第一个匹配项的方法,或者您的选择器中存在错误 快速浏览该站点表明,如果您使用并选择“basket_table”类,您将得到一个包含三个表的列表,后两个是您正在查看的表
如果我右键单击并在浏览器中查看源代码,那么我可以看到两个团队的表,但当我使用BeautifulSoup刮取数据时,表在那里,但里面没有数据。在没有任何代码的情况下帮助您调试代码有点困难;-) 但是,我猜您可能正在使用只返回第一个匹配项的方法,或者您的选择器中存在错误 快速浏览该站点表明,如果您使用并选择“basket_table”类,您将得到一个包含三个表的列表,后两个是您正在查看的表 查看如何按css类进行搜索的说明
希望它有帮助在没有任何代码的情况下帮助您调试代码有点困难;-) 但是,我猜您可能正在使用只返回第一个匹配项的方法,或者您的选择器中存在错误 快速浏览该站点表明,如果您使用并选择“basket_table”类,您将得到一个包含三个表的列表,后两个是您正在查看的表 查看如何按css类进行搜索的说明
希望对您有所帮助我为您制作了演示,您可以参考以下内容:
import requests, bs4
r = requests.get('http://www.basket.ee/et/meistriliiga/1/ajakava-ja-tulemused/?gid=2017001101')
soup = bs4.BeautifulSoup(r.text, 'lxml')
tables = soup.find_all('table', class_='basket_table')[1:]
for table in tables:
for tr in table('tr', attrs=False):
row = [cell.text for cell in tr(['td', 'th'])]
print(row)
输出:
我为您制作了演示,您可以参考以下内容:
import requests, bs4
r = requests.get('http://www.basket.ee/et/meistriliiga/1/ajakava-ja-tulemused/?gid=2017001101')
soup = bs4.BeautifulSoup(r.text, 'lxml')
tables = soup.find_all('table', class_='basket_table')[1:]
for table in tables:
for tr in table('tr', attrs=False):
row = [cell.text for cell in tr(['td', 'th'])]
print(row)
输出:
谢谢你的回答,但我设法找到了一种方法,使我的脚本工作以及。我刚刚用
“lxml”
替换了“html\u解析器”
。谢谢你的回答,但我设法找到了一种方法让我的脚本也能正常工作。我刚刚用“lxml”
替换了“html\u解析器”
。