Xpath 如何从一个div中提取所有文本,包括来自具有Scrapy和Xpah的兄弟的文本?
在使用scrapy 2.4从远程URL提取文本时,我发现它只返回此div中的文本,而不返回其子节点中的文本 例如 我需要提取此div中的整个文本,包括合并到一个非格式化字符串中的所有子节点的文本。尝试以下操作:Xpath 如何从一个div中提取所有文本,包括来自具有Scrapy和Xpah的兄弟的文本?,xpath,scrapy,Xpath,Scrapy,在使用scrapy 2.4从远程URL提取文本时,我发现它只返回此div中的文本,而不返回其子节点中的文本 例如 我需要提取此div中的整个文本,包括合并到一个非格式化字符串中的所有子节点的文本。尝试以下操作: /div//text() 这样就可以将任何嵌套文本放入内部元素。有趣的方法!谢谢你的工作。您知道如何将.extract()连接到一个字符串中吗?我想我必须使用join()方法对每个元素进行分类(通过对每个元素进行条带化),在.Nice中有一个例子!非常感谢。 <div>
/div//text()
这样就可以将任何嵌套文本放入内部元素。有趣的方法!谢谢你的工作。您知道如何将.extract()连接到一个字符串中吗?我想我必须使用
join()
方法对每个元素进行分类(通过对每个元素进行条带化),在.Nice中有一个例子!非常感谢。
<div>
text
<p>text inside child</p>
<h2>bla</h2>
more text
</div>
all_text = response.xpath('/div/text()').extract()