Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Xpath 从@href属性获取一个值_Xpath_Web Scraping_Scrapy - Fatal编程技术网

Xpath 从@href属性获取一个值

Xpath 从@href属性获取一个值,xpath,web-scraping,scrapy,Xpath,Web Scraping,Scrapy,我正在废弃一个基于javascript的系统分页网站,因此我想从@href属性中提取页码,这是链接的外观: <a href="javascript:AllerAPage('1', 'element_id');">Page 1</a> 支持: 请注意,//a/@hrefxpath表达式是一个示例-您可能有一个不同的表达式 演示显示了我提供的正则表达式的工作: >>> import re >>> s = "javascript:Alle

我正在废弃一个基于javascript的系统分页网站,因此我想从@href属性中提取页码,这是链接的外观:

<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a>

支持:

请注意,
//a/@href
xpath表达式是一个示例-您可能有一个不同的表达式

演示显示了我提供的正则表达式的工作:

>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'
>>> import re
>>> s = "javascript:AllerAPage('1', 'element_id');"
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1)
'1'