Html 如何使用XPath选择div中的所有文本内容？_Html_Xml_Xpath_Scrapy

Html 如何使用XPath选择div中的所有文本内容？

html xml xpath scrapy

Html 如何使用XPath选择div中的所有文本内容？,html,xml,xpath,scrapy,Html,Xml,Xpath,Scrapy,我想选择div中的所有文本，而不考虑其中的标记 <div> <p>some text here <a href="">a link here <span>span here<span></a></p> </div> 请检查以下代码以获得澄清 response.xpath('//div//text()') 并尝试以下操作以获得所需的输出 " ".join([i.strip() for i in t

我想选择

div

中的所有文本，而不考虑其中的标记

<div>
<p>some text here <a href="">a link here  <span>span here<span></a></p>
</div>

请检查以下代码以获得澄清

response.xpath('//div//text()')

并尝试以下操作以获得所需的输出

" ".join([i.strip() for i in tree.xpath('//div//text()') if i.strip()])

尝试

string（）

XPath：

response.xpath('string(//div)').extract_first()

您正在询问该

div

的字符串值：

string(/div)

或者，如果希望从结尾处修剪空白并在内部合并：

normalize-space(/div)

normalize-space(/div)