Python 检索以scrapy中的开头的href
我试图从Python 检索以scrapy中的开头的href,python,xpath,scrapy,Python,Xpath,Scrapy,我试图从磁铁开始提取href: item['magnet']=response.xpath('/[@id=“content”]/article/div[以(@href,“magnet:”)]/@href')开头。extract() 我得到的结果是空的 提前感谢您的帮助。我建议1.提取所有标签,而不是尝试使用磁铁提取特定链接。 2.在href属性: def parse(self, response): .... item["magnet"] = [link fo
磁铁开始提取href
:
item['magnet']=response.xpath('/[@id=“content”]/article/div[以(@href,“magnet:”)]/@href')开头。extract()
我得到的结果是空的
提前感谢您的帮助。我建议
1.提取所有
标签,而不是尝试使用磁铁提取特定链接。
2.在href
属性:
def parse(self, response):
....
item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]
我建议
1.提取所有
标记,而不是尝试使用磁铁提取特定链接。
2.在href
属性:
def parse(self, response):
....
item["magnet"] = [link for link in response.css("a::attr(href)").extract() if "magnet:" in link]
您的包含的缺少一个)
。顺便说一句,xpath还有以
开头的。是的,谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href,可能路径不正确,magnet在类条目内容中,但我仍然无法检索href(empy result,无错误)您缺少)
,因为您的包含。顺便说一句,xpath还有以
开头的。是的,谢谢。我更正了这个问题。在每个页面中至少有一个以magnet开头的href,可能路径不正确,magnet在类条目内容中,但我仍然无法检索href(empy result,无错误),它非常有效,谢谢。我只需要把它放在一个列表中,然后取第一个->[0]它非常有效,谢谢。我只需要把它放在一个列表中,然后取第一个->[0]