Python 检索以scrapy中的开头的href_Python_Xpath_Scrapy - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 检索以scrapy中的开头的href_Python_Xpath_Scrapy - Fatal编程技术网

Python 检索以scrapy中的开头的href

python xpath scrapy

Python 检索以scrapy中的开头的href,python,xpath,scrapy,Python,Xpath,Scrapy,我试图从磁铁开始提取href： item['magnet']=response.xpath（'/[@id=“content”]/article/div[以（@href，“magnet:”）]/@href'）开头。extract（）我得到的结果是空的提前感谢您的帮助。我建议1.提取所有标签，而不是尝试使用磁铁提取特定链接。 2.在href属性： def parse(self, response): .... item["magnet"] = [link fo

我试图从

磁铁开始提取href
：
item['magnet']=response.xpath（'/[@id=“content”]/article/div[以（@href，“magnet:”）]/@href'）开头。extract（）

我得到的结果是空的
提前感谢您的帮助。
我建议
1.提取所有
标签，而不是尝试使用磁铁提取特定链接。

2.在href
属性：

def parse(self, response):
    ....
    item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]

我建议
1.提取所有
标记，而不是尝试使用磁铁提取特定链接。

2.在href
属性：

def parse(self, response):
    ....
    item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]

您的包含的缺少一个）
。顺便说一句，xpath还有以
开头的。是的，谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href，可能路径不正确，magnet在类条目内容中，但我仍然无法检索href（empy result，无错误）您缺少）
，因为您的包含。顺便说一句，xpath还有以
开头的。是的，谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href，可能路径不正确，magnet在类条目内容中，但我仍然无法检索href（empy result，无错误），它非常有效，谢谢。我只需要把它放在一个列表中，然后取第一个->[0]它非常有效，谢谢。我只需要把它放在一个列表中，然后取第一个->[0]




[xpath]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Tableau api 数字和日期度量值的条件格式
tableau-api 
Tableau api 带形状的甘特图
tableau-api 
Tableau api 创建具有2000万行的提取的最佳方法是什么？
tableau-api 
Tableau api 在堆栈栏中子集数据
tableau-api 
Tableau api 表中具有相同值的两个字段的条形图
tableau-api 
Tableau api 是否可以从表格中复制突出显示的数字？
tableau-api 
Tableau api Tableau桌面将列标题移动到底部
tableau-api 
Tableau api 表-如何将过去12个月的值求和
tableau-api 
Tableau api 在表格中，如何在标题中显示仪表板刷新日期？
tableau-api 
Tableau api Tableau计算字段标题中的记录总数
tableau-api 
Tableau api 如何在tableau中创建连续非雨天排名列表
tableau-api 
Tableau api 如何将筛选器选择的项目传递到tableau中的Tabby
tableau-api 
Tableau api 如何在Tableau中将3个直方图组合成1个图形？
tableau-api


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
从函数内部调用Python函数
									Python
							 
Python 是否导入从命令行传递的任意数量的模块？（归结为“如何解开字符串？”）
									Python
							 									String
							 									Import
							 
Python 从request.GET动态构造筛选器
									Python
							 									Django
							 
Python错误：re.findall比re.sub找到更多匹配项
									Python
							 									Regex
							 
如何在python中创建elasticsearch节点客户端
									Python
							 
Python 正则表达式：在文本中搜索HTML标记
									Python
							 									Regex
							 									Url
							 
在python中如何在循环中保持attr集
									Python
							 									Loops
							 
Python从csv读取行，操作和组织数字行
									Python
							 									Csv
							 									Statistics
							 
Python 搔痒爬行
									Python
							 									Security
							 									Web
							 									Scrapy
							 									Web Crawler
							 
获取数字字符串Python
									Python
							 									String
							 									For Loop
							 
如何在python中转换十六进制？
									Python
							 
Python似乎不从文本文件中读取
									Python
							 									Printing
							 
Python 保存到一个文件和排序后的最高分数！巨蟒游戏
									Python
							 
Python 如何将电子邮件地址与重复编号匹配
									Python
							 									Regex
							 									Python 3.x
							 
继续对Python2.7产生意外的不了解
									Python
							 
Python 如何实现根据用户单击的内容更改GUI中的值的代码？
									Python
							 									Tkinter
							 
Python 无法使用keras-ImportError:没有名为'_pywrap_tensorflow_internal'；
									Python
							 									Python 3.x
							 									Tensorflow
							 									Keras
							 									Anaconda
							 
Python 为包含可变长度序列的数组的输出标签创建分类numpy数组
									Python
							 									Numpy
							 									Scikit Learn
							 									Keras
							 
Python 熊猫约会时间&；累积毫秒
									Python
							 									Pandas
							 									Datetime
							 
Python Flask未将数据url字符串放入模板
									Python
							 									Html
							 									Svg
							 									Flask
							 
Python 列“中的空值”；“用户id”；违反非空约束详细信息：失败的行包含（34,30,null）
									Python
							 									Django
							 
Pythonywhere WSGI错误（未找到解决方案如何设置is）
									Python
							 
如何在Python中将1d数组广播到N-D数组
									Python
							 									Numpy
							 
Python Django：如何将html表从模板传输到数据库表？
									Python
							 									Django
							 
Python 是否有一种有效的算法对大数据阵列进行聚类
									Python
							 
Python 如何填充n维数组
									Python
							 									Nlp
							 
为什么mysql与Python的连接失败了？
									Python
							 									Mysql
							 
Python 如何将C程序按其功能块拆分？
									Python
							 									Regex
							 
Python 如何将列数据转换为行
									Python
							 									Pandas
							 
Python 如何在线程中获得输出？
									Python
							 									Multithreading
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Synchronization
Computer Vision
Jakarta Ee
Sql Server 2005
Bots
Hadoop
Mpi
Logstash
Routing
Instagram
View
Wix
Redis
Service
Android Layout
Rdf
Maps
File Upload
Websocket
Zend Framework
Meteor
Twitter Bootstrap 3
Macos
Amazon Dynamodb
Asp.net Mvc 3
Oop
Flash
Aframe
Transactions
Ruby
Coding Style
Google App Engine
Xampp
Seo
Indexing
Pycharm
Windows Store Apps
Hybris
Twilio
Image
Youtube Api
Octave
Ffmpeg
Leaflet
Verilog
Nhibernate
Routes
Composer Php
Vb.net
Azure
Python 2.7
Opengl
Continuous Integration
Hbase
Search
Cryptography
Authentication
Knockout.js
Listview
Socket.io
Spring Batch
Bison
Angular Material
Github
Gmail
Rx Java
C++ Cli
Model
Atom Editor
Codeigniter
Mongodb
Data Structures
Tags
Dependency Injection
Streaming
Debugging
Asp Classic
Filter
Applescript
Opencart
Google Cloud Storage
Documentation
Compiler Construction
Plsql
Actionscript
Maven
Uml
Swift
Function
Symfony1
Groovy
Model View Controller
Zurb Foundation
Elixir
Openid
Phpunit
Migration
Collections
Firefox Addon
Wxpython
Sharepoint
Certificate
Google Visualization
D
Menu
Ant
Binary
Shiny
Button
Xaml
Lisp
Corda
Sequelize.js
Devexpress
Input
F#
Jestjs
Erlang
Typo3
Cmd
Ada
Django
Resharper
Dataframe
Rspec
Cookies
Ocaml
Vmware
Html
Couchbase
.net 4.0
Yocto
Map
Youtube
Responsive Design
Asp.net Mvc
Ibm Cloud
Extjs
Karate
Api
Visual Studio 2008
Intellij Idea
Hive
E Commerce
Monitoring
Drools
Operating System
Lotus Notes
Jaxb
.net Core
Spring Integration
Fiware
C++11
Xmpp
Filesystems
Opencv
Sqlalchemy
Axapta
Rally
Nlp
Nestjs
Spring Mvc
Lambda
Ssas
C# 3.0
Directory
Dynamics Crm
Blackberry
Design Patterns
Z3
Tfs
Cassandra
Sharepoint 2010
Sql
Sql Server
Serial Port
Junit
If Statement
Soap
Url
Fluent Nhibernate
Hyperlink
Julia
Google Cloud Platform
Jquery Ui
Mariadb
Objective C
Spring
Coffeescript
Data Binding
Animation
Modelica
Kdb
Iframe
Ajax
Scala
.net
Loops
Random
For Loop
Login


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网