Html 如何使用XPath选择div中的所有文本内容?

Html 如何使用XPath选择div中的所有文本内容?,html,xml,xpath,scrapy,Html,Xml,Xpath,Scrapy,我想选择div中的所有文本,而不考虑其中的标记 <div> <p>some text here <a href="">a link here <span>span here<span></a></p> </div> 请检查以下代码以获得澄清 response.xpath('//div//text()') 并尝试以下操作以获得所需的输出 " ".join([i.strip() for i in t

我想选择
div
中的所有文本,而不考虑其中的标记

<div>
<p>some text here <a href="">a link here  <span>span here<span></a></p>
</div>

请检查以下代码以获得澄清

response.xpath('//div//text()')
并尝试以下操作以获得所需的输出

" ".join([i.strip() for i in tree.xpath('//div//text()') if i.strip()])
尝试
string()
XPath:

response.xpath('string(//div)').extract_first()
您正在询问该
div
的字符串值:

string(/div)
或者,如果希望从结尾处修剪空白并在内部合并:

normalize-space(/div)
normalize-space(/div)