Python 如何用靓汤收集元素?
我正试图用漂亮的汤做一个网页刮板,但每次我尝试刮板网站,我都没有得到任何回报。在下面的代码中,我使用请求获取网站,然后将其放入beautiful soup对象中。在那之后,我试着去刮所有的标签 我试着看了youtube教程,看了框架的文档,但我不知道如何使用它Python 如何用靓汤收集元素?,python,web,beautifulsoup,Python,Web,Beautifulsoup,我正试图用漂亮的汤做一个网页刮板,但每次我尝试刮板网站,我都没有得到任何回报。在下面的代码中,我使用请求获取网站,然后将其放入beautiful soup对象中。在那之后,我试着去刮所有的标签 我试着看了youtube教程,看了框架的文档,但我不知道如何使用它 from bs4 import BeautifulSoup import bs4 import urllib url = requests.get("https://www.rt.com/") print(url.status_cod
from bs4 import BeautifulSoup
import bs4
import urllib
url = requests.get("https://www.rt.com/")
print(url.status_code)
soup = BeautifulSoup(url.content, 'html.parser')
soup.find_all('div')
您缺少
请求
包,并且没有对结果执行任何操作
从bs4导入美化组
导入请求
url=请求。获取(“https://www.rt.com/")
打印(url.状态\ U代码)
soup=BeautifulSoup(url.content,'html.parser')
divs=soup.find_all('div')#将结果保存到变量
#打印每个div内的文本(如何使用结果的示例)
对于div中的div:
打印(div.text)
您缺少请求
包,并且没有对结果进行任何处理
从bs4导入美化组
导入请求
url=请求。获取(“https://www.rt.com/")
打印(url.状态\ U代码)
soup=BeautifulSoup(url.content,'html.parser')
divs=soup.find_all('div')#将结果保存到变量
#打印每个div内的文本(如何使用结果的示例)
对于div中的div:
打印(div.text)
首先,您的代码此时不起作用,因为您忘记了导入请求包。因此,一旦导入包,它就会工作
第二,我建议你仔细阅读《美丽的群像》。它有你需要的所有答案。因此,如果您需要该页面上的所有锚点,只需将它们分配给如下所示的变量:
elems = soup.find_all('a')
之后,您可以像处理结果集一样使用它,因此,如果需要从锚元素中提取链接,您可以执行以下操作:
for link in elems:
print(link.get('href'))
# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie
首先,您的代码此时无法工作,因为您忘记了导入请求包。因此,一旦导入包,它就会工作 第二,我建议你仔细阅读《美丽的群像》。它有你需要的所有答案。因此,如果您需要该页面上的所有锚点,只需将它们分配给如下所示的变量:
elems = soup.find_all('a')
之后,您可以像处理结果集一样使用它,因此,如果需要从锚元素中提取链接,您可以执行以下操作:
for link in elems:
print(link.get('href'))
# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie