过滤<;脚本>;使用xpath
... ... … 我想提取这个div节点中的所有文本,我的xpath表达式类似于:'string(//div)。过滤<;脚本>;使用xpath,xpath,web-scraping,scrapy,Xpath,Web Scraping,Scrapy,... ... … 我想提取这个div节点中的所有文本,我的xpath表达式类似于:'string(//div)。 但这也会得到脚本标签中的文本,如何删除它们?感谢从div获取文本节点,排除script节点中的文本,您可以尝试 <div> <p>...</p> <script>...</script> <p>...</p> <script>...</script>
但这也会得到脚本标签中的文本,如何删除它们?感谢从
div
获取文本节点,排除script
节点中的文本,您可以尝试
<div>
<p>...</p>
<script>...</script>
<p>...</p>
<script>...</script>
<p>...</p>
</div>
这回答了你的问题吗?
//div//text()[not(parent::script)]