Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 检索以scrapy中的开头的href_Python_Xpath_Scrapy - Fatal编程技术网

Python 检索以scrapy中的开头的href

Python 检索以scrapy中的开头的href,python,xpath,scrapy,Python,Xpath,Scrapy,我试图从磁铁开始提取href: item['magnet']=response.xpath('/[@id=“content”]/article/div[以(@href,“magnet:”)]/@href')开头。extract() 我得到的结果是空的 提前感谢您的帮助。我建议1.提取所有标签,而不是尝试使用磁铁提取特定链接。 2.在href属性: def parse(self, response): .... item["magnet"] = [link fo

我试图从
磁铁开始提取
href

item['magnet']=response.xpath('/[@id=“content”]/article/div[以(@href,“magnet:”)]/@href')开头。extract()

我得到的结果是空的


提前感谢您的帮助。

我建议
1.提取所有
标签,而不是尝试使用
磁铁提取特定链接。

2.在
href
属性:

def parse(self, response):
    ....
    item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]

我建议
1.提取所有
标记,而不是尝试使用
磁铁提取特定链接。

2.在
href
属性:

def parse(self, response):
    ....
    item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]

您的
包含的
缺少一个
。顺便说一句,xpath还有以
开头的
。是的,谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href,可能路径不正确,magnet在类条目内容中,但我仍然无法检索href(empy result,无错误)您缺少
,因为您的
包含
。顺便说一句,xpath还有以
开头的
。是的,谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href,可能路径不正确,magnet在类条目内容中,但我仍然无法检索href(empy result,无错误),它非常有效,谢谢。我只需要把它放在一个列表中,然后取第一个->[0]它非常有效,谢谢。我只需要把它放在一个列表中,然后取第一个->[0]