Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Xpath 如何从一个div中提取所有文本,包括来自具有Scrapy和Xpah的兄弟的文本?_Xpath_Scrapy - Fatal编程技术网

Xpath 如何从一个div中提取所有文本,包括来自具有Scrapy和Xpah的兄弟的文本?

Xpath 如何从一个div中提取所有文本,包括来自具有Scrapy和Xpah的兄弟的文本?,xpath,scrapy,Xpath,Scrapy,在使用scrapy 2.4从远程URL提取文本时,我发现它只返回此div中的文本,而不返回其子节点中的文本 例如 我需要提取此div中的整个文本,包括合并到一个非格式化字符串中的所有子节点的文本。尝试以下操作: /div//text() 这样就可以将任何嵌套文本放入内部元素。有趣的方法!谢谢你的工作。您知道如何将.extract()连接到一个字符串中吗?我想我必须使用join()方法对每个元素进行分类(通过对每个元素进行条带化),在.Nice中有一个例子!非常感谢。 <div>

在使用scrapy 2.4从远程URL提取文本时,我发现它只返回此div中的文本,而不返回其子节点中的文本

例如

我需要提取此div中的整个文本,包括合并到一个非格式化字符串中的所有子节点的文本。

尝试以下操作:

/div//text()


这样就可以将任何嵌套文本放入内部元素。

有趣的方法!谢谢你的工作。您知道如何将.extract()连接到一个字符串中吗?我想我必须使用
join()
方法对每个元素进行分类(通过对每个元素进行条带化),在.Nice中有一个例子!非常感谢。
<div>
    text
    <p>text inside child</p>
    <h2>bla</h2>
    more text
</div>
all_text = response.xpath('/div/text()').extract()