Xpath 如何从一个div中提取所有文本，包括来自具有Scrapy和Xpah的兄弟的文本？_Xpath_Scrapy

Xpath 如何从一个div中提取所有文本，包括来自具有Scrapy和Xpah的兄弟的文本？

xpath scrapy

Xpath 如何从一个div中提取所有文本，包括来自具有Scrapy和Xpah的兄弟的文本？,xpath,scrapy,Xpath,Scrapy,在使用scrapy 2.4从远程URL提取文本时，我发现它只返回此div中的文本，而不返回其子节点中的文本例如我需要提取此div中的整个文本，包括合并到一个非格式化字符串中的所有子节点的文本。尝试以下操作： /div//text（）这样就可以将任何嵌套文本放入内部元素。有趣的方法！谢谢你的工作。您知道如何将.extract（）连接到一个字符串中吗？我想我必须使用join（）方法对每个元素进行分类（通过对每个元素进行条带化），在.Nice中有一个例子！非常感谢。 <div>

在使用scrapy 2.4从远程URL提取文本时，我发现它只返回此div中的文本，而不返回其子节点中的文本

例如

我需要提取此div中的整个文本，包括合并到一个非格式化字符串中的所有子节点的文本。

尝试以下操作：

/div//text（）

这样就可以将任何嵌套文本放入内部元素。

有趣的方法！谢谢你的工作。您知道如何将.extract（）连接到一个字符串中吗？我想我必须使用

join（）

方法对每个元素进行分类（通过对每个元素进行条带化），在.Nice中有一个例子！非常感谢。

<div>
    text
    <p>text inside child</p>
    <h2>bla</h2>
    more text
</div>

all_text = response.xpath('/div/text()').extract()