分页—python中爬虫程序的xpath

分页—python中爬虫程序的xpath,python,xpath,scrapy,web-crawler,Python,Xpath,Scrapy,Web Crawler,我实际上正在用python中的scrapy开发一个爬虫程序,我几乎完成了,我只是有一个小问题。 网站使用的分页方式如下: <div class="pagination toolbarbloc"> <ul> <li class="active"><span>1</span></li> <li><a href

我实际上正在用python中的scrapy开发一个爬虫程序,我几乎完成了,我只是有一个小问题。 网站使用的分页方式如下:

<div class="pagination toolbarbloc">
            <ul>
                    <li class="active"><span>1</span></li>
                    <li><a href="...">2</a></li>
                    <li><a href="...">3</a></li>
                    <li><a href="...">4</a></li>
                    <li><a href="...">5</a></li>
                    <li><a class="end" href="...">>></li>
            </ul>
        </div>
next_page_url_xpath = '//div[@class="pagination toolbarbloc"]/ul/following-sibling::li[@class="active"]/a/@href'
但它不起作用:索引器:列表索引超出范围

我只是从xpath开始,我知道它很简单,但在阅读了大量文档之后,我没有成功地使用它

非常感谢那些帮助我的人

试试下面的表达式:

//div[@class="pagination toolbarbloc"]/ul/li[@class="active"]/following-sibling::li/a/@href

请注意,您在
[class=“pagination toolbarbloc”]
中错过了
@
li
不是
ul

'//div[class=“pagination toolbarbloc”]//a[@href]/@href'的兄弟姐妹,我认为这个会很好用。选择a的href属性,该属性a具有href属性,并且是div的子节点,类为“pagination toolbarbloc”,谢谢我的编辑!我记得我试过这种方法,但没用,但现在没事了!谢谢