Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/339.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何在div中标识id的名称?_Python_Xpath_Web Scraping - Fatal编程技术网

Python 如何在div中标识id的名称?

Python 如何在div中标识id的名称?,python,xpath,web-scraping,Python,Xpath,Web Scraping,我正试图编写一个程序来识别div中的id并返回id的名称 <div id="page0" class="subpage"> <h2 id="RM10129"> Cold Startes </h2> <div id="RM10129" class="menubox"></div> <div id="RM10129" class="menubox"></div>

我正试图编写一个程序来识别div中的id并返回id的名称

<div id="page0" class="subpage">
      <h2 id="RM10129"> Cold Startes </h2>
        <div id="RM10129" class="menubox"></div>
        <div id="RM10129" class="menubox"></div>
      <h2 id="RM10130"> Main </h2>
        <div id="RM10130" class="menubox"></div>
        <div id="RM10130" class="menubox"></div>

冷起动
主要

我希望我的程序返回ID“RM10129”和“RM10130”。xpath是否可以这样做?

您可以使用
starts-with()
检查
id
是否以
RM
开头:

//div[@id='page0']/div[starts-with(@id, 'RM') and @class = 'menubox']/@id
您可以将以下内容用作lib的一部分:

import lxml.html
ttt=”“”
冷起动
主要
"""
page=lxml.html.fromstring(ttt)
打印page.xpath('.//div[@class=“menubox”]/@id')

并继续进一步验证。

此xpath将返回DIV中ID为page0的所有DIV ID

//div[@id="page0"]/div/@id

您当前使用什么包来解析HTML?向我们展示迄今为止您拥有的代码。谢谢
//div[@id="page0"]/div/@id