Xpath 从@href属性获取一个值
我正在废弃一个基于javascript的系统分页网站,因此我想从@href属性中提取页码,这是链接的外观:Xpath 从@href属性获取一个值,xpath,web-scraping,scrapy,Xpath,Web Scraping,Scrapy,我正在废弃一个基于javascript的系统分页网站,因此我想从@href属性中提取页码,这是链接的外观: <a href="javascript:AllerAPage('1', 'element_id');">Page 1</a> 支持: 请注意,//a/@hrefxpath表达式是一个示例-您可能有一个不同的表达式 演示显示了我提供的正则表达式的工作: >>> import re >>> s = "javascript:Alle
<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>
支持:
请注意,//a/@href
xpath表达式是一个示例-您可能有一个不同的表达式
演示显示了我提供的正则表达式的工作:
>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'
>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'