Python 使用scrapy从选定链接中提取标题和url链接
我想从这个网站只提取10个链接这个链接可以在页面底部找到,其中一些是美国在线,谷歌等 这是我的密码:Python 使用scrapy从选定链接中提取标题和url链接,python,scrapy,Python,Scrapy,我想从这个网站只提取10个链接这个链接可以在页面底部找到,其中一些是美国在线,谷歌等 这是我的密码: import scrapy class cr(scrapy.Spider): name = 'prcr' start_urls = ['https://dmoz-odp.org/Sports/Events/'] def parse(self, response): items = '.alt-sites' for i in respons
import scrapy
class cr(scrapy.Spider):
name = 'prcr'
start_urls = ['https://dmoz-odp.org/Sports/Events/']
def parse(self, response):
items = '.alt-sites'
for i in response.css(items):
title=response.css('a::attr(title)').extract()
link=response.css('a::attr(href)').extract()
yield dict(title=title, titletext=link)
这很好,但我只需要提取最后10个链接,所以请告诉我怎么做?我对您的解析方法做了一些更改(检查下面的代码),这应该很好
def parse(self, response):
items = '.alt-sites a'
for i in response.css(items):
title = i.css('::text').extract_first()
link = i.css('::attr(href)').extract_first()
yield dict(title=title, title_link=link)
希望这对你有帮助