Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/xpath/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
过滤<;脚本>;使用xpath_Xpath_Web Scraping_Scrapy - Fatal编程技术网

过滤<;脚本>;使用xpath

过滤<;脚本>;使用xpath,xpath,web-scraping,scrapy,Xpath,Web Scraping,Scrapy,... ... … 我想提取这个div节点中的所有文本,我的xpath表达式类似于:'string(//div)。 但这也会得到脚本标签中的文本,如何删除它们?感谢从div获取文本节点,排除script节点中的文本,您可以尝试 <div> <p>...</p> <script>...</script> <p>...</p> <script>...</script>

...

... …

我想提取这个div节点中的所有文本,我的xpath表达式类似于:'string(//div)
但这也会得到脚本标签中的文本,如何删除它们?感谢从
div
获取文本节点,排除
script
节点中的文本,您可以尝试

<div>
   <p>...</p>
   <script>...</script>
   <p>...</p>
   <script>...</script>
   <p>...</p> 
</div>

这回答了你的问题吗?
//div//text()[not(parent::script)]