分页—python中爬虫程序的xpath_Python_Xpath_Scrapy_Web Crawler

分页—python中爬虫程序的xpath

python xpath scrapy web-crawler

分页—python中爬虫程序的xpath,python,xpath,scrapy,web-crawler,Python,Xpath,Scrapy,Web Crawler,我实际上正在用python中的scrapy开发一个爬虫程序，我几乎完成了，我只是有一个小问题。网站使用的分页方式如下： <div class="pagination toolbarbloc"> <ul> <li class="active"><span>1</span></li> <li><a href

我实际上正在用python中的scrapy开发一个爬虫程序，我几乎完成了，我只是有一个小问题。网站使用的分页方式如下：

<div class="pagination toolbarbloc">
            <ul>
                    <li class="active"><span>1</span></li>
                    <li><a href="...">2</a></li>
                    <li><a href="...">3</a></li>
                    <li><a href="...">4</a></li>
                    <li><a href="...">5</a></li>
                    <li><a class="end" href="...">>></li>
            </ul>
        </div>

next_page_url_xpath = '//div[@class="pagination toolbarbloc"]/ul/following-sibling::li[@class="active"]/a/@href'

但它不起作用：索引器：列表索引超出范围

我只是从xpath开始，我知道它很简单，但在阅读了大量文档之后，我没有成功地使用它

非常感谢那些帮助我的人

试试下面的表达式：

//div[@class="pagination toolbarbloc"]/ul/li[@class="active"]/following-sibling::li/a/@href

请注意，您在

[class=“pagination toolbarbloc”]

中错过了

，

li

不是

ul

'//div[class=“pagination toolbarbloc”]//a[@href]/@href'的兄弟姐妹，我认为这个会很好用。选择a的href属性，该属性a具有href属性，并且是div的子节点，类为“pagination toolbarbloc”，谢谢我的编辑！我记得我试过这种方法，但没用，但现在没事了！谢谢