在python中使用webscraping获取知识

在python中使用webscraping获取知识,python,web-scraping,Python,Web Scraping,我只是想刮一个网站,以获得标题和产品描述等只是为了练习,我已经抓住了产品名称,但我不知道如何抓住以下东西 在这里,我只是想抓住产品名称和它的描述。 我成功地获得了冠军 from requests_html import HTML,HTMLSession session = HTMLSession() r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20car

我只是想刮一个网站,以获得标题和产品描述等只是为了练习,我已经抓住了产品名称,但我不知道如何抓住以下东西

在这里,我只是想抓住产品名称和它的描述。 我成功地获得了冠军

from requests_html import HTML,HTMLSession
session = HTMLSession()
r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20card')
containers =  r.html.find('.item-container',first=True)
#print(containers.html)
title = containers.find('.item-branding img',first=True).attrs['title']
#print(title)
description = containers.find('.item-title',first=True).html
print(description)
但问题在于描述,我想获取
i
i
标签内的数据,该标签显示产品描述,我无法这样做,请提供任何帮助

由此:


我想抓住这个:

EVGA GeForce RTX 2080 Ti DirectX 12 11G-P4-2281-KR黑色版游戏视频卡,双HDB风扇和;RGB发光二极管

我建议使用[BeautifulSoup][1]以便刮取本网站的内容,您的代码应如下所示:

from requests_html import HTML, HTMLSession
from bs4 import BeautifulSoup

session = HTMLSession()
r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20card')
soup = BeautifulSoup(r.content,"lxml")

containers = soup.find("div", {"class","item-container"})
title = containers.findAll("img", {"class":"lazy-img"})[1]["title"]
description = containers.find("a",{"class":"item-title"}).getText()
print(description)
希望这有帮助
[1] :

基本上类似于
链接.text