Python 如何在div中标识id的名称?
我正试图编写一个程序来识别div中的id并返回id的名称Python 如何在div中标识id的名称?,python,xpath,web-scraping,Python,Xpath,Web Scraping,我正试图编写一个程序来识别div中的id并返回id的名称 <div id="page0" class="subpage"> <h2 id="RM10129"> Cold Startes </h2> <div id="RM10129" class="menubox"></div> <div id="RM10129" class="menubox"></div>
<div id="page0" class="subpage">
<h2 id="RM10129"> Cold Startes </h2>
<div id="RM10129" class="menubox"></div>
<div id="RM10129" class="menubox"></div>
<h2 id="RM10130"> Main </h2>
<div id="RM10130" class="menubox"></div>
<div id="RM10130" class="menubox"></div>
冷起动
主要
我希望我的程序返回ID“RM10129”和“RM10130”。xpath是否可以这样做?您可以使用
starts-with()
检查id
是否以RM
开头:
//div[@id='page0']/div[starts-with(@id, 'RM') and @class = 'menubox']/@id
您可以将以下内容用作lib的一部分:
import lxml.html
ttt=”“”
冷起动
主要
"""
page=lxml.html.fromstring(ttt)
打印page.xpath('.//div[@class=“menubox”]/@id')
并继续进一步验证。此xpath将返回DIV中ID为page0的所有DIV ID
//div[@id="page0"]/div/@id
您当前使用什么包来解析HTML?向我们展示迄今为止您拥有的代码。谢谢
//div[@id="page0"]/div/@id