Html 为未知深度编写XPath表达式

Html 为未知深度编写XPath表达式,html,xpath,web-scraping,scrapy,Html,Xpath,Web Scraping,Scrapy,我有一个html文件,类似于: <div id='author'> <div> <div> ... <a> John Doe </a> 但这似乎只适用于author div的孙子辈。使用双斜杠在div元素中的任何位置查找a元素,并使用id=“author”: //div[@id = "author"]/*/a/text() //div[@id = "author"]/

我有一个html文件,类似于:

<div id='author'> 
   <div>
      <div>
         ...

             <a> John Doe </a>

但这似乎只适用于author div的孙子辈。

使用双斜杠在
div
元素中的任何位置查找
a
元素,并使用
id=“author”

//div[@id = "author"]/*/a/text()
//div[@id = "author"]//a/text()