Python 如何用靓汤收集元素？_Python_Web_Beautifulsoup

Python 如何用靓汤收集元素？

python web

Python 如何用靓汤收集元素？,python,web,beautifulsoup,Python,Web,Beautifulsoup,我正试图用漂亮的汤做一个网页刮板，但每次我尝试刮板网站，我都没有得到任何回报。在下面的代码中，我使用请求获取网站，然后将其放入beautiful soup对象中。在那之后，我试着去刮所有的标签我试着看了youtube教程，看了框架的文档，但我不知道如何使用它 from bs4 import BeautifulSoup import bs4 import urllib url = requests.get("https://www.rt.com/") print(url.status_cod

我正试图用漂亮的汤做一个网页刮板，但每次我尝试刮板网站，我都没有得到任何回报。在下面的代码中，我使用请求获取网站，然后将其放入beautiful soup对象中。在那之后，我试着去刮所有的标签

我试着看了youtube教程，看了框架的文档，但我不知道如何使用它

from bs4 import BeautifulSoup
import bs4
import urllib

url = requests.get("https://www.rt.com/")

print(url.status_code)

soup = BeautifulSoup(url.content, 'html.parser')

soup.find_all('div')

您缺少

请求

包，并且没有对结果执行任何操作

从bs4导入美化组
导入请求
url=请求。获取（“https://www.rt.com/")
打印（url.状态\ U代码）
soup=BeautifulSoup（url.content，'html.parser'）
divs=soup.find_all（'div'）#将结果保存到变量
#打印每个div内的文本（如何使用结果的示例）
对于div中的div：
打印（div.text）

您缺少

请求

包，并且没有对结果进行任何处理

从bs4导入美化组
导入请求
url=请求。获取（“https://www.rt.com/")
打印（url.状态\ U代码）
soup=BeautifulSoup（url.content，'html.parser'）
divs=soup.find_all（'div'）#将结果保存到变量
#打印每个div内的文本（如何使用结果的示例）
对于div中的div：
打印（div.text）

首先，您的代码此时不起作用，因为您忘记了导入请求包。因此，一旦导入包，它就会工作

第二，我建议你仔细阅读《美丽的群像》。它有你需要的所有答案。因此，如果您需要该页面上的所有锚点，只需将它们分配给如下所示的变量：

 elems = soup.find_all('a')

之后，您可以像处理结果集一样使用它，因此，如果需要从锚元素中提取链接，您可以执行以下操作：

for link in elems:
    print(link.get('href'))

# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie

首先，您的代码此时无法工作，因为您忘记了导入请求包。因此，一旦导入包，它就会工作

第二，我建议你仔细阅读《美丽的群像》。它有你需要的所有答案。因此，如果您需要该页面上的所有锚点，只需将它们分配给如下所示的变量：

 elems = soup.find_all('a')

之后，您可以像处理结果集一样使用它，因此，如果需要从锚元素中提取链接，您可以执行以下操作：

for link in elems:
    print(link.get('href'))

# http://example.com/elsie
# http://example.com/lacie
# http://example.com/tillie