尝试使用Python和BeautifulSoup进行web刮取的初学者

尝试使用Python和BeautifulSoup进行web刮取的初学者,python,python-3.x,beautifulsoup,Python,Python 3.x,Beautifulsoup,我是所有编码的初学者 我需要从那些赢得所有州奖项的高中足球运动员中挑选一份名单 我深入到这个问题中,并被引导到Python和BeautifulSoup中,以便进行web刮取 我想出了下面的代码,但我很难弄清楚如何只获取玩家信息 我得到了一堆标题、链接和补充,但不是我想要的信息 任何提示都将不胜感激。这就是我到目前为止想到的。仁慈点 import urllib import urllib.request from bs4 import BeautifulSoup theurl = "https:

我是所有编码的初学者

我需要从那些赢得所有州奖项的高中足球运动员中挑选一份名单

我深入到这个问题中,并被引导到Python和BeautifulSoup中,以便进行web刮取

我想出了下面的代码,但我很难弄清楚如何只获取
玩家信息

我得到了一堆标题、链接和补充,但不是我想要的信息

任何提示都将不胜感激。这就是我到目前为止想到的。仁慈点

import urllib
import urllib.request
from bs4 import BeautifulSoup

theurl = "https://cumberlink.com/sports/high-school/football/pa-football-writers-all-state-team- 
class-a-a-and/article_4d286757-a501-5b5b-b3be-cfebc06ef455.html"
thepage = urllib.request.urlopen (theurl)
soup = BeautifulSoup (thepage, "html.parser")

print (soup.title.text)

""""""
for link in soup.findAll('p'):
   print (link.get('href'))
   print (link.text)

""""""
print (soup.find('div', {"class":"subscriber-only"}))

另外,如果有人能帮助我了解如何将其导入到
Excel
文件中,我可以让它自动转换为图表格式。例如(
玩家
位置
学校
身高
体重
年份
奖励
,等等)

基本上你不需要使用
urllib
,因为Python已经有了一个很棒的模块,就是
请求

如果您希望使用
打印(soup.title.text)
,它将为您提供页面的
标题

下面是通过它的

import requests
from bs4 import BeautifulSoup

r = requests.get('https://cumberlink.com/sports/high-school/football/pa-football-writers-all-state-team-class-a-a-and/article_4d286757-a501-5b5b-b3be-cfebc06ef455.html').text
soup = BeautifulSoup(r, 'html.parser')

for item in soup.findAll('div', {"class": "subscriber-only"}):
    print(item.text)

您能分享打印报表的输出吗?您想从页面中获取什么?给我们举个例子欢迎来到StackOverflow,而且。。。在这里申请。StackOverflow是针对特定编程问题的知识库,而不是设计、编码、研究或教程资源。目前,你的主要问题似乎是不耐烦:学习所需的每一项技术都需要时间。幸运的是,您拥有搜索教程的正确关键字。2018宾夕法尼亚州。足球作家所有国家队:6A、4A和2A级| Football | cumberlink.com无©2019 Lee Enterprises无服务条款|隐私政策无。低37华氏度。风轻而多变。。没有多云。低37华氏度。风轻而多变。无更新:2019年11月19日晚上7:37无年度最佳球员:凯尔·麦考德,圣约瑟夫预备队无年度最佳教练:卡尔文·埃弗里特,哈里斯堡这只是输出的一部分,太长了,无法在评论部分发布。有办法贴照片吗?再多一点。。。年度最佳教练:卡尔文·埃弗雷特,哈里斯堡无凯尔·麦考德,圣约瑟夫预备队-6-3,195名大二无凯恩·埃弗森,哈里斯堡-5-11,180名大四无凯德·普里布拉,纽约中部-6-1200名大四无瑞奇·奥尔特加,科特斯维尔-6-0,190名小无那是一个伟大的开始,谢谢。我将学习更多关于在Excel中格式化它的内容。你是怎么做到只抓取名字和数据的?我想我不明白为什么我的代码会抓取其他信息。我将学习“请求”模块。@iFreeSki420关于
Excel
过程。请提出一个新问题,因为这将是完全不同的方法。@iFreeSki420在这种情况下,年份应该是什么?年份将是2018年。课堂将是另一个二年级的专栏。你太棒了,谢谢你!欢迎光临。只要提出一个新问题,就能帮助你