Python 将序列的第n个编号输入到Scrapy Start URL';s
我正在寻找一种速记方法,将序列的第n项输入到Scrapy start URL中。例如,这是添加第24个的较长版本:Python 将序列的第n个编号输入到Scrapy Start URL';s,python,scrapy,scrapy-spider,Python,Scrapy,Scrapy Spider,我正在寻找一种速记方法,将序列的第n项输入到Scrapy start URL中。例如,这是添加第24个的较长版本: start_urls = ['https://www.example.com/us/shopping?items=24' , 'https://www.example.com/us/shopping?items=48' , 'https://www.example.com/us/shopping?items=
start_urls = ['https://www.example.com/us/shopping?items=24' ,
'https://www.example.com/us/shopping?items=48' ,
'https://www.example.com/us/shopping?items=72']
我发现像这样的URL模式在电子商务网站中很常见。对于顺序中的每一个数字,以下各项都很有效,但我无法将其更改为第n个数字:
start_urls = (
"https://www.example.com/us/shopping?items=%s" % page for page in xrange(0,20)
)
任何帮助都将不胜感激。在
xrange
中的第三个参数允许您提供增量多少的步骤
我想这就是你想要的:
start_urls = [
"https://www.example.com/us/shopping?items=%s" % page for page in xrange(24, 73, 24)
]
上面的代码将生成与示例中相同的列表
第一个参数(24)是从何处开始,第二个参数(73)是从何处停止(排他,因此73在72处停止),第三个参数(24)告诉xrange它要增加多少。xrange
中的第三个参数允许您提供一个关于它要增加多少的步骤
我想这就是你想要的:
start_urls = [
"https://www.example.com/us/shopping?items=%s" % page for page in xrange(24, 73, 24)
]
上面的代码将生成与示例中相同的列表
第一个参数(24)是从何处开始,第二个参数(73)是从何处停止(互斥,因此73在72处停止),第三个参数(24)告诉xrange它的增量是多少。第n个数字是什么意思?您期望的输出是什么?起始URL遵循一个固定的模式,其中一个数字发生变化,在上面的示例中,它是24、48、72、96,依此类推。在本例中,它位于URL的末尾。我想知道如何将这个数字序列添加到起始URL。像xrange,但每次只针对第24个数字。你说的第n个数字是什么意思?您期望的输出是什么?起始URL遵循一个固定的模式,其中一个数字发生变化,在上面的示例中,它是24、48、72、96,依此类推。在本例中,它位于URL的末尾。我想知道如何将这个数字序列添加到起始URL。类似于xrange,但每次仅适用于第24个数字。