Python Scrapy：将嵌入href中的文本刮除_Python_Xpath_Scrapy - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Scrapy：将嵌入href中的文本刮除_Python_Xpath_Scrapy - Fatal编程技术网

Python Scrapy：将嵌入href中的文本刮除

python xpath scrapy

Python Scrapy：将嵌入href中的文本刮除,python,xpath,scrapy,Python,Xpath,Scrapy,我使用Scrapy刮取内容，如下所示： >>> response.css(".mt-0.mb-2").extract() ['<h4 class="mt-0 mb-2">\n\t\t\t\t\t\t<a href="https://www.example.com/results/item1/">THIS IS WHAT I WANT TO SCRAPE</a> </h4>', '<h4

我使用Scrapy刮取内容，如下所示：

>>> response.css(".mt-0.mb-2").extract()

['<h4 class="mt-0 mb-2">\n\t\t\t\t\t\t<a href="https://www.example.com/results/item1/">THIS IS WHAT I WANT TO SCRAPE</a>                    </h4>', '<h4 class="mt-0 mb-2">\n\t\t\t\t\t\t<a href=…

在处理这些类型的选择器时，XPath是提取它们的唯一方法吗？

以及

response.css（“.mt-0.mb-2 a:：text”）.extract（）是什么？或者可能我误解了这个问题？
以及response.css（“.mt-0.mb-2A:：text”）.extract（）是什么意思？或者我误解了这个问题？
我只得到了制表符和空格，而不是实际的字符串“这是我要刮的”。你看到了吗，在css表达式中，我们添加了a
，并将其文本与a:：text
。你试过了吗？抱歉我没看到！谢谢，这将帮助我更好地理解如何处理嵌套资源。我得到的只是制表符和空格，而不是实际的字符串“这是我想要刮取的”。您是否看到我们在css表达式中添加了a
，并将其文本与a:：text。你试过了吗？抱歉我没看到！谢谢，这将帮助我更好地理解如何处理嵌套资源。
>>> response.css(".mt-0.mb-2::text").extract()

['\n\t\t\t\t\t\t', '                    ', '\n\t\t\t\t\t\t', '                    ', '\n\t\t\t\t\t\t', '                    ', '\n\t\t\t\t\t\t',




[xpath]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Elasticsearch 基于嵌套项聚合的嵌套文档中的求和值
kibana 
Elasticsearch 基巴纳分离器
kibana 
如何可视化平铺地图Kibana elasticsearch
kibana 
Elasticsearch Kibana查询字符串长度
kibana 
如何在Mac OS上运行kibana 4.1.3？
kibana 
如何使用ElasticSearch和Kibana获取DAU/WAU/MAU图表？
kibana 
Elasticsearch 查询格式错误，应为END_对象，但在Kibana中发现字段_名称错误（弹性搜索）
kibana 
Kibana共享仪表板（iframe）-过滤器
kibana 
Elasticsearch kibana如何授予用户角色或访问权限，使其只查看一个仪表板？
kibana 
Elasticsearch Kibana WAU条形图
kibana 
Elasticsearch 在弹性搜索Kibana中找到的单词的特定范围内搜索特定单词
kibana 
elasticsearch的设置主管
kibana 
elasticsearch中的应用程序端连接示例
kibana 
Elasticsearch ELK群集上运行的metricbeat代理？
kibana 
Elasticsearch 如何在Kibana中将自定义字段视为标准类型而不是未知类型？
kibana 
Elasticsearch 获取此根映射定义的参数不受支持：在Kibana控制台中运行下面的查询时，mapper_parsing_异常
kibana 
Elasticsearch Kibana显示太多桶异常。如何增加铲斗或是否有更好的方法处理此问题？
kibana 
Elasticsearch查询-每个用户的最新日志，用于字段logtype='；x'；
kibana 
Elasticsearch Kibana开发工具撤消PUT请求
kibana 
如何从ElasticSearch查询5年前的数据？
kibana


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
只下载我需要的selenium（Python 2.7）
									Python
							 									Selenium
							 									Python 2.7
							 
Python 当我知道函数I'；你被嘲弄了，有人打电话吗？
									Python
							 									Unit Testing
							 									Testing
							 
Python 无法访问HTML表单上的文本框
									Python
							 									Forms
							 									Login
							 									Input
							 
为python脚本创建可执行文件时出错
									Python
							 
python嵌套生成器对象内容
									Python
							 									Object
							 
Python 从列表中查找并删除元素，同时保留位置以供以后插入
									Python
							 									Python 2.7
							 
动态设置深层python dict
									Python
							 									Dictionary
							 
Python gevent&x27；StreamServer'；对象没有属性'；启动前&x27；？
									Python
							 
Python 对可编辑网页使用Django cms？
									Python
							 									Django
							 
Python 链式多输出回归
									Python
							 									Machine Learning
							 									Scikit Learn
							 
Python stremio中的交互式bokeh小部件
									Python
							 
Python 如何使SQL炼金术和动态
									Python
							 									Sqlalchemy
							 
Python Pyinstaller"；FileNotFoundError:[Errno 2]没有这样的文件或目录："；运行应用程序时
									Python
							 									Python 3.x
							 
Python 如何创建基于模板的表并在多个DITA xml中使用它，以及如何通过它填充数据
									Python
							 
Python 使用Django按连接数查询多对多关系
									Python
							 									Django
							 									Database
							 
Python 比较对象实例的属性是否相等
									Python
							 
十进制Python字典
									Python
							 
Python 迭代数据帧的两列，根据前两列中的查找为第三列指定值
									Python
							 									Pandas
							 
Python /模型/列车http API在提供“时出现500错误；nlu&x201D；json格式的数据
									Python
							 
通过python中的用户输入删除和更新字典键/值
									Python
							 									Python 3.x
							 									Dictionary
							 									Jupyter Notebook
							 
Python API网关Lambda授权人-“；由于授权人错误，执行失败"；-如何排除故障？
									Python
							 									Amazon Web Services
							 									Aws Lambda
							 
python 3:urllib.error.HTTPError:HTTP错误403:禁止
									Python
							 									Json
							 
在PHP中调用Python代码并显示输出
									Python
							 									Php
							 
使用python脚本获取用户输入和编写结果的网站
									Python
							 									Dynamic
							 
在C++；项目
项目是什么：一个C++库，在上面我们想添加一个运行时预测模块，它由Python插件组成（例如，建模阶段的插件，另一个用于预测，另一个用于特征聚类等）。目标操作系统是GNU/Linux
									Python
							 									C++
							 									Architecture
							 
Python 没有名为pymysql的模块
									Python
							 									Apache
							 									Django Rest Framework
							 
使用Python的SQL注入
									Python
							 									Mysql
							 
在python中的多线程程序中，只有一个子线程工作，即使我使用join（）程序也没有正常退出
									Python
							 									Multithreading
							 
Python 使用K-means的数据集的三维打印
									Python
							 									Scikit Learn
							 
Python ked in@alecxe的答案提供了一个函数，它似乎就是您想要的。这是一个很好的方法，应该是事实上的方法。但是，我会注意到，如果表单的作者没有正确设置selecthtml元素，那么您可能必须使用更迟钝的“xpath”版本。如果只是使用输入字段，xpath
									Python
							 									Selenium
							 									Selenium Webdriver
							 									Drop Down Menu
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Import
Marklogic
Processing
Opencart
Json
Dll
Ruby On Rails 3.2
Stm32
Architecture
Functional Programming
Mongoose
Mercurial
Python Sphinx
Generics
Apache Flink
Python 2.7
Button
Hazelcast
Sas
Uiview
Docusignapi
Types
Hadoop
Authentication
Migration
Outlook
Spring Cloud
Grails
Dynamics Crm
Ios8
Tcl
Ios4
Sms
Uitableview
Erlang
View
Coldfusion
Clang
Javafx
Activemq
Acumatica
Pip
Asp.net Mvc 3
Plugins
Validation
Logstash
Spring
Gradle
Amp Html
Perl
Ldap
Events
Swift3
Web Scraping
Binary
Makefile
Xmpp
Rest
Grep
Mqtt
Optimization
Pyspark
Eclipse Rcp
Iframe
Redux
Webgl
Windows Phone 8
Indexing
Netlogo
Xcode
Node.js
Typo3
Groovy
Twilio
Macros
Sharepoint 2007
Doxygen
Typescript
Ajax
Dotnetnuke
Cocos2d X
Visual Studio 2017
Geometry
Collections
Regex
Extjs4
Drupal 7
Primefaces
Azure Cosmosdb
Vb.net
Nativescript
Amazon Cloudformation
Ionic2
Grid
Angular Material
Tridion
Vmware
Isabelle
Asp.net Mvc
C# 4.0
Amazon Redshift
Yaml
Testing
Robotframework
Scripting
File Upload
String
Nlp
Discord
Testng
Orm
System Verilog
Quickbooks
Yii2
Xamarin.forms
Active Directory
Pdf
Url Rewriting
Azure Data Factory
Apache Kafka
Sugarcrm
Wordpress
Ibm Midrange
Calendar
Hive
Path
Compression
Mapping
Webstorm
Orientdb
Flash
Animation
C# 3.0
Floating Point
Websocket
Jsf
Encryption
Silverlight
Arm
Cocoa Touch
Gremlin
Telegram
Asp.net Mvc 4
Antlr4
Android Layout
Windows Phone 8.1
Opencv
Content Management System
Artifactory
Io
Csv
Jwt
Version Control
Asp.net Mvc 5
Terminal
Sitecore
Keycloak
Struct
Twitter Bootstrap
Matplotlib
C++
Post
Big O
Memory Management
Menu
Fonts
Sails.js
Zend Framework
Webview
Hybris
Safari
Bison
Java 8
Ipad
Doctrine Orm
Eclipse Plugin
Unicode
Openerp
Deep Learning
Logging
Google Calendar Api
Google Analytics
Ipython
Compiler Errors
Asp Classic
Kotlin
Vhdl
Asp.net Core Mvc
Reference
Linux
Session
Build
Jaxb
D
Xamarin
Docker
Rdf
Tabs
Chart.js
Nginx
Xampp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网