Xpath 从@href属性获取一个值_Xpath_Web Scraping_Scrapy

Xpath 从@href属性获取一个值

xpath web-scraping scrapy

Xpath 从@href属性获取一个值,xpath,web-scraping,scrapy,Xpath,Web Scraping,Scrapy,我正在废弃一个基于javascript的系统分页网站，因此我想从@href属性中提取页码，这是链接的外观： <a href="javascript:AllerAPage('1', 'element_id');">Page 1</a> 支持：请注意，//a/@hrefxpath表达式是一个示例-您可能有一个不同的表达式演示显示了我提供的正则表达式的工作： >>> import re >>> s = "javascript:Alle

我正在废弃一个基于javascript的系统分页网站，因此我想从@href属性中提取页码，这是链接的外观：

<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>

支持：

请注意，

//a/@href

xpath表达式是一个示例-您可能有一个不同的表达式

演示显示了我提供的正则表达式的工作：

>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'

>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'