Html 如何使用XPath选择div中的所有文本内容?
我想选择Html 如何使用XPath选择div中的所有文本内容?,html,xml,xpath,scrapy,Html,Xml,Xpath,Scrapy,我想选择div中的所有文本,而不考虑其中的标记 <div> <p>some text here <a href="">a link here <span>span here<span></a></p> </div> 请检查以下代码以获得澄清 response.xpath('//div//text()') 并尝试以下操作以获得所需的输出 " ".join([i.strip() for i in t
div
中的所有文本,而不考虑其中的标记
<div>
<p>some text here <a href="">a link here <span>span here<span></a></p>
</div>
请检查以下代码以获得澄清
response.xpath('//div//text()')
并尝试以下操作以获得所需的输出
" ".join([i.strip() for i in tree.xpath('//div//text()') if i.strip()])
尝试string()
XPath:
response.xpath('string(//div)').extract_first()
您正在询问该div
的字符串值:
string(/div)
或者,如果希望从结尾处修剪空白并在内部合并:
normalize-space(/div)
normalize-space(/div)