Html 为未知深度编写XPath表达式
我有一个html文件,类似于:Html 为未知深度编写XPath表达式,html,xpath,web-scraping,scrapy,Html,Xpath,Web Scraping,Scrapy,我有一个html文件,类似于: <div id='author'> <div> <div> ... <a> John Doe </a> 但这似乎只适用于author div的孙子辈。使用双斜杠在div元素中的任何位置查找a元素,并使用id=“author”: //div[@id = "author"]/*/a/text() //div[@id = "author"]/
<div id='author'>
<div>
<div>
...
<a> John Doe </a>
但这似乎只适用于author div的孙子辈。使用双斜杠在
div
元素中的任何位置查找a
元素,并使用id=“author”
:
//div[@id = "author"]/*/a/text()
//div[@id = "author"]//a/text()