在python中使用webscraping获取知识_Python_Web Scraping - Fatal编程技术网

在python中使用webscraping获取知识

python web-scraping

在python中使用webscraping获取知识,python,web-scraping,Python,Web Scraping,我只是想刮一个网站，以获得标题和产品描述等只是为了练习，我已经抓住了产品名称，但我不知道如何抓住以下东西在这里，我只是想抓住产品名称和它的描述。我成功地获得了冠军 from requests_html import HTML,HTMLSession session = HTMLSession() r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20car

我只是想刮一个网站，以获得标题和产品描述等只是为了练习，我已经抓住了产品名称，但我不知道如何抓住以下东西

在这里，我只是想抓住产品名称和它的描述。我成功地获得了冠军

from requests_html import HTML,HTMLSession
session = HTMLSession()
r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20card')
containers =  r.html.find('.item-container',first=True)
#print(containers.html)
title = containers.find('.item-branding img',first=True).attrs['title']
#print(title)
description = containers.find('.item-title',first=True).html
print(description)

但问题在于描述，我想获取

内

标签内的数据，该标签显示产品描述，我无法这样做，请提供任何帮助

由此：

我想抓住这个：

EVGA GeForce RTX 2080 Ti DirectX 12 11G-P4-2281-KR黑色版游戏视频卡，双HDB风扇和；RGB发光二极管

我建议使用[BeautifulSoup][1]以便刮取本网站的内容，您的代码应如下所示：

from requests_html import HTML, HTMLSession from bs4 import BeautifulSoup session = HTMLSession() r = session.get('https://www.newegg.com/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20card') soup = BeautifulSoup(r.content,"lxml") containers = soup.find("div", {"class","item-container"}) title = containers.findAll("img", {"class":"lazy-img"})[1]["title"] description = containers.find("a",{"class":"item-title"}).getText() print(description)
希望这有帮助
[1] ：
基本上类似于
链接.text
。

[web scraping]相关文章推荐

Web scraping 我可以追踪谁在链接或操纵我的网站吗；谁的数据？ web-scraping

Web scraping 亚马逊产品广告项目查找IFrame页面大小 web-scraping

Web scraping 使用bs4和请求删除起始页 web-scraping

Web scraping 哪种最简单的方法可以从抓取的web数据中剥离HTML，从而只剩下字符串？ web-scraping nlp

Web scraping 登录在SplashAPI中工作，但在使用SplashRequest时不工作 web-scraping scrapy

Web scraping Scrapy：当满足条件时，如何在start_url中抓取下一个url web-scraping scrapy

Web scraping 在没有API访问的情况下访问ServiceNow？ web-scraping

Web scraping 网页抓取谷歌表单脚本 web-scraping google-sheets

Web scraping 为什么我在抓取网页时得到的是一个空列表，而不是一个包含元素的列表 web-scraping

随机文章推荐

Ruby on rails 3.1 一对一关系问题-Rails ruby-on-rails-3.1

Ruby on rails 3.1 Rails 3.1和静态页面我正处于将大型应用程序从Rails 3升级到Rails 3.1的过程中，并对页面控制器的实现产生了一个问题： when templates doesnt exist should render the 404 page (FAILED - 1) Failures: 1) PagesController automatic paths when templates doesnt exist should render the 404 page ruby-on-rails-3.1

Ruby on rails 3.1 在Rails 3.1中加载print.css ruby-on-rails-3.1

Ruby on rails 3.1 rake资产：预编译速度很慢 ruby-on-rails-3.1

Ruby on rails 3.1 rails 3.1.0：生产中未加载指纹图像 ruby-on-rails-3.1

Ruby on rails 3.1 所有查询默认为公司用户 ruby-on-rails-3.1

Ruby on rails 3.1 Rails 3.1上带有Mongoid的未初始化常量modelname ruby-on-rails-3.1

Ruby on rails 3.1 启用资产管道后，如何提高本地主机的性能？ ruby-on-rails-3.1

Ruby on rails 3.1 从其父应用程序运行rails引擎的规范 ruby-on-rails-3.1 rspec

Ruby on rails 3.1 使用Rails部分中断文档树？ ruby-on-rails-3.1

[python]相关推荐

用于GAE Web服务安全检查的Python装饰器
Python Google App Engine Web Services

Python 更改字符串中的2个字节
Python String

Python Web处理程序regex路由配置的调优
Python Regex Google App Engine Web Applications Routing

Python 使用相机检测运动有哪些好方法？（opencv）
Python Opencv

Python 试图解析源IP'；从apache访问日志中删除，并将输出写入文件，但只写入1个ip
Python Apache Parsing

有没有办法在特定时间用python脚本启动计算机？
Python

Python 使用lambda函数过滤可重用项
Python Python 3.x Lambda

Python 仅当条件为true时才将元组添加到字典
Python Dictionary

Python Django配置：未正确配置settings.DATABASES
Python Django

Python 解包关键字参数（kwargs）的正确方法
Python

Python 将任何单参数函数转换为生成函数？
Python Function

du命令和Python函数之间的文件大小差异
Python Bash Recursion

Python 如何得到正好有2个1'；在其二进制表示的范围内？
Python Python 2.7

为什么Python会像这样附加到数据帧？
Python Pandas

Python 选择一个数字的某个数字
Python

在python中，什么是默认的第一个参数而不是第二个参数？
Python Python 3.x

Python 在特定子文件夹中创建子文件夹
Python Python 2.7

Python 使用lambda的字符串中整数的和
Python Lambda

如何将所有定义的函数从python脚本1导入python脚本2？
Python Function Import

Python 使用自定义卷加权聚合进行熊猫重采样
Python Pandas

Python 等效于列表理解的映射不起作用
Python Matplotlib Syntax

Python 带if/else的内联函数：检查返回值并附加到条件列表中，不调用函数两次
Python

Python相当于Tcl'；s"；字符串匹配“；
Python String Tcl

Python 伪造者从哪里获得伪造数据？
Python

Python 如何向另一个Google应用程序引擎应用程序写入？
Python Django Google App Engine

Python Spark KafkaUtils DirectStream错误：属性security.protocol、ssl.truststore.location无效
Python Apache Spark Pyspark Apache Kafka

Python 负R2_分数使用LightGBM对我的销售预测问题进行了错误预测
Python

Python中的UIA/MSAA？
Python Windows

Python 有两个条件的累积和？
Python Pandas

Python 替换Pandas中列表类型列中的重复项
Python Pandas List

Tags

Hadoop Vb6 Entity Framework 4 Silverstripe Azure Sql Database Docker Compose Terminal Push Notification Open Source Ssh Coldfusion Bots Visual Studio 2008 Rabbitmq Lucene Autodesk Forge Azure Functions Laravel Single Sign On Ubuntu Windows Autohotkey Flutter Mysql Security Biztalk Sorting Bash Boost Object Google Visualization Redirect Phantomjs Cordova Stata Editor Maven Geometry Drupal Tfs Xampp Erlang Heroku Memory Zsh Winforms Virtualbox Dictionary Architecture Coffeescript Pytorch Keyboard Apache Storm Wolfram Mathematica Proxy Phpunit Air C# Ssrs 2008 Process Internationalization Osgi Jpa Actionscript 3 Nsis Canvas Raspberry Pi Cron Vuejs2 Session Xna Apache Flex Opencl Android Emulator Frameworks Openssl Blazor Codeigniter Formatting Opengl Mapping Jms Neural Network Python 2.7 E Commerce Chef Infra Amazon Redshift Date Pycharm Nosql Arrays Ffmpeg Laravel 4 Solr Networking Cmd Extjs Linq Log4net .net Binding Apache2 Qml Usb Discord.py Compression Dynamic Ruby On Rails Statistics Google Sheets Html5 Canvas Ide Ipython Sql Server Servlets Google App Maker Influxdb Zurb Foundation Xmpp Tridion Java 8 Plugins Video Streaming Smalltalk Internet Explorer 8 Youtube Api Nhibernate Chart.js Properties Graphql Triggers Cassandra Replace Orientdb Devexpress Calendar Appium Spring Mvc Navigation Gmail Gdb Xaml Nservicebus Doxygen Server Php Iis 7 Youtube Shopify Docker Amazon Web Services Blockchain Stm32 Ajax Vaadin Io Entity Framework Quickbooks Swift2 Typescript Primefaces Ibm Midrange Corda Debian Deep Learning System Verilog Layout Cocos2d Iphone Orm Visual Studio 2012 Gremlin Html Webview Interface Octave Apache Sharepoint If Statement Drupal 6 Dns Couchbase Jasmine Awk Azure Ad B2c Tomcat Perl Gitlab Gridview Swagger Numpy Razor Makefile User Interface Swiftui Ignite Database Design Coq Stored Procedures Mpi Google Cloud Firestore Hive

Copyright © 2024. All Rights Reserved by - Fatal编程技术网