XPATH从CarWale.com提取数据?

XPATH从CarWale.com提取数据?,xpath,extract,Xpath,Extract,在一位朋友的帮助下,我制作了一个脚本,从页面中提取所有规格和功能,如 ,但效果并不完美 他告诉我使用XPath//tr[contains(,“featurename”)]/td[2],但其中一个是不可能选择的,使用//tr[contains(,“Display”)]/td[2]它提取了4个包含wordDisplay的特性。有没有办法只选择一个贴有标签的显示器 <td>Trip Meter</td><td>Multi-Function Display </

在一位朋友的帮助下,我制作了一个脚本,从页面中提取所有规格和功能,如 ,但效果并不完美

他告诉我使用XPath
//tr[contains(,“featurename”)]/td[2]
,但其中一个是不可能选择的,使用
//tr[contains(,“Display”)]/td[2]
它提取了4个包含word
Display
的特性。有没有办法只选择一个贴有标签的显示器

<td>Trip Meter</td><td>Multi-Function Display </td>
<td>Heads Up Display (HUD)</td><td>No </td>
<td>Display</td><td>LCD Display </td>
<td>Display Screen for Rear Passengers</td><td>No </td>

如果前面的同级包含“Display”,则提取包含“Display”的“td”标记:

//tr/td[contains(.,'Display')]/following-sibling::td[contains(.,'Display')]
提取RGB十六进制字符串:

//div/substring-before(substring-after(@style,'background-color: '),';')

要将包含display的同级'td'标记转换为包含display的'td'标记,您可以执行以下操作:
//tr/td[contains(,'display')]/following sibling::td[contains(,'display')]
未提取任何内容,[INVALID XPATH EXPRESSION],我仍在等待有人帮助。Chrome中的XPATH Helper扩展名为[INVALID XPATH EXPRESSION]我不熟悉XPath助手,我已经用(选择XPath 2.0)测试了这些示例,并将它们与来自
//div/substring-before(substring-after(@style,'background-color: '),';')