Python 剪贴式xpath删除<；之后的文本；性格_Python_Xpath_Web Scraping_Scrapy_Parsel - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/361.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 剪贴式xpath删除<；之后的文本；性格_Python_Xpath_Web Scraping_Scrapy_Parsel - Fatal编程技术网

Python 剪贴式xpath删除<；之后的文本；性格

python xpath web-scraping scrapy

Python 剪贴式xpath删除<；之后的文本；性格,python,xpath,web-scraping,scrapy,parsel,Python,Xpath,Web Scraping,Scrapy,Parsel,我正在尝试从页面获取产品信息。为了获得描述（显示在页面底部），我使用xpath response.xpath('//*[@itemprop="description"]/table//text()').extract()[3].strip() 这给了我描述： u'Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section (' 而

我正在尝试从页面获取产品信息。为了获得描述（显示在页面底部），我使用xpath

response.xpath('//*[@itemprop="description"]/table//text()').extract()[3].strip()

这给了我描述：

u'Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section ('

而现场的一个是

Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section (<2cm), Belt Length: 93cm
Product Type: Belts, Accessories

颜色：白色，尺寸：自由尺寸，带主体：编织，带扣：自动扣减，带主体宽度：截面（这仍然应该在没有任何破解的情况下进行处理，但您可以通过以下方式实现：
from parsel import Selector
...

s = Selector(text=response.body_as_unicode(), type='xml')
s.xpath('//*[@itemprop="description"]/table//text()').extract()[3].strip()
# gives u'Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section (2cm), Belt Length: 93cm'

这里的问题是parsel
（内部scrapy
解析器）使用lxml.etree.HtmlParser（recover=True，encoding='utf8'）
来删除这种奇怪的字符以避免问题。
它看起来像是因为这是一个parsel
错误而被切断的，我将在存储库中检查它




[xpath]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Cocos2d iphone 如何在cocos2d中将int类变量从一个类传递到另一个类
cocos2d-iphone 
Cocos2d iphone 以类似于使用CCRepeatForever移动CCSprites的方式重复移动box2d实体
cocos2d-iphone 
Cocos2d iphone Cocos2D-c动画：现在显示的是哪一帧？
cocos2d-iphone 
Cocos2d iphone 如何在不使用动作的情况下移动精灵？
cocos2d-iphone 
Cocos2d iphone cocos2diphone制作流背景效果的几个问题
cocos2d-iphone 
Cocos2d iphone Cocos2d子弹运动
cocos2d-iphone 
Cocos2d iphone 二维力
cocos2d-iphone 
Cocos2d iphone 我能在空气中增加摩擦力吗？
cocos2d-iphone 
Cocos2d iphone 更改可变数组中的对象CCSprite图像
cocos2d-iphone 
Cocos2d iphone iOS6&x2B；ARC&x2B；cocos2D+；UIKit:已发送到解除分配实例的消息
cocos2d-iphoneios6 
Cocos2d iphone mono touch中绑定类型的子类化
cocos2d-iphonexamarin.ios 
Cocos2d iphone Cocos2D如何删除/释放/清理CCMenu
cocos2d-iphone 
Cocos2d iphone 雪碧没有'；与box2d一起使用时，请勿更改比例
cocos2d-iphone 
Cocos2d iphone 如何使单个ccsprite在不使用sprite工作表的情况下加载得更快
cocos2d-iphone 
Cocos2d iphone CCParallaxNode在滚动时添加子节点
cocos2d-iphone 
Cocos2d iphone 在cocos2d中查找缩放的图像宽度和高度
cocos2d-iphone 
Cocos2d iphone 制作分数递增计数器
cocos2d-iphone 
Cocos2d iphone 如何在cocos2d iphone中按随机时间间隔调度或调用方法
cocos2d-iphone 
Cocos2d iphone 对象没有'；我不能向右飞
cocos2d-iphone 
Cocos2d iphone 如何在cocos2d iphone中创建带有for循环的按钮
cocos2d-iphone


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Install4j
Firefox
Openssl
Yii2
Loopbackjs
Kernel
Google App Maker
D3.js
Tomcat
Embedded
Crystal Reports
Amp Html
Report
Opengl Es
Redux
Tsql
Arangodb
Cassandra
Osgi
Azure Ad B2c
Cron
Mediawiki
Syntax
Automation
Import
Anaconda
Xpages
Processing
Scrapy
Weblogic
Db2
Directx
Internet Explorer
Odata
Architecture
Geolocation
View
Stm32
Laravel
Iframe
Kendo Ui
Ms Access
Kdb
Teradata
Pointers
Asp.net Web Api
Ocaml
Objective C
Couchbase
Dart
Vb6
Pentaho
Kubernetes
Snmp
Jasmine
Fiware
Session
Yii
Spring Mvc
Visual Studio 2015
Websocket
Push Notification
File Io
Google Maps
Inno Setup
Cloud Foundry
Google Maps Api 3
Typescript
Big O
Random
Netty
Teamcity
Collections
Scala
Phpmyadmin
Dialogflow Es
Vbscript
Time Complexity
Reporting Services
Reference
Class
Ipython
Text
Image Processing
Sed
Twitter
Cmake
Java
Yaml
Windbg
Scripting
Cors
Electron
Android Studio
Mpi
Layout
Opencv
Svg
Ubuntu
Emacs
Oracle
Maven 2
Domain Driven Design
Perforce
Scheme
Dask
Flask
Prestashop
Parallel Processing
Z3
Gps
Appium
Excel
Ssh
Angular
Doctrine Orm
Eclipse Rcp
Windows 8
Asp.net Mvc
Ember.js
Testng
Artifactory
Data Structures
Here Api
Asp Classic
Actions On Google
Zurb Foundation
Api
Tree
Frameworks
Cygwin
Jms
Amazon Ec2
Xcode
Websphere
Couchdb
Pandas
C++11
Sapui5
Jmeter
Exchange Server
Fluent Nhibernate
Serial Port
For Loop
Swiftui
Algorithm
Openerp
Selenium Webdriver
Ruby On Rails 4
Salesforce
Dependency Injection
Ruby On Rails 3.2
Loops
Twig
Replace
Discord.js
Unicode
C
Ide
Cakephp
Openid
Encoding
Coffeescript
Struct
Windows Phone 8.1
Aws Lambda
Google Chrome Devtools
Phpstorm
Module
Asp.net Mvc 4
Timer
Math
Mongoose
Gdb
Ethereum
Open Source
Dynamics Crm
Windows Runtime
Mapreduce
Visual Studio 2012
Winforms
Solr
Usb
Google Compute Engine
Unity3d
Indexing
Visual Studio 2013
Nunit
Bots
Marklogic
Robotframework
Xmpp
Xamarin
Listview
Swagger
Reflection
Android Emulator
Angularjs
Ionic2
Visual Studio 2008
Compression


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网