Python XPATH将嵌套的文本作为目标<;a>;在a<;p>;标签

Python XPATH将嵌套的文本作为目标<;a>;在a<;p>;标签,python,xpath,web-scraping,scrapy,Python,Xpath,Web Scraping,Scrapy,我正在尝试将目标文本放在标记中。还有一些标记也有嵌套的标记,我的XPATH没有针对这些标记的文本值 链接: 下面是我正在使用的XPATH://article//p/text() 当然,我可以do//article//p//text()和目标文本,但这也会得到我不想提取的其他链接。我只想获取标记内的所有文本,如果有任何嵌套标记,也要获取该值 我怎样才能达到这样的结果呢 谢谢大家。由于大多数粉红色链接都以“学习”开头,我可能会这样说: a = response.xpath('//article//

我正在尝试将目标文本放在标记中。还有一些标记也有嵌套的标记,我的XPATH没有针对这些标记的文本值

链接:

下面是我正在使用的XPATH:
//article//p/text()

当然,我可以
do//article//p//text()
和目标文本,但这也会得到我不想提取的其他链接。我只想获取标记内的所有文本,如果有任何嵌套标记,也要获取该值

我怎样才能达到这样的结果呢


谢谢大家。

由于大多数粉红色链接都以“学习”开头,我可能会这样说:

a = response.xpath('//article//p//a//text()').extract()
if "Learn" not in a and "Back to top" not in a:
    print(response.xpath('//article//p/text()').extract())

我不确定你想提取什么。您编写了“我只想获取标记内部的所有文本,如果存在任何嵌套标记,也要获取该值”,因为该目标
//article//p/a//text()
可以实现,但我认为这不是您想要的。从你的图片上看,你似乎不想看到
a
标签本身,只是那些混在文本中的标签,但你没有提到它。你能详细说明你想要选择什么和不想要什么吗?