Python XPATH将嵌套的文本作为目标<；a>；在a<；p>；标签_Python_Xpath_Web Scraping_Scrapy

Python XPATH将嵌套的文本作为目标<；a>；在a<；p>；标签

python xpath web-scraping scrapy

Python XPATH将嵌套的文本作为目标<；a>；在a<；p>；标签,python,xpath,web-scraping,scrapy,Python,Xpath,Web Scraping,Scrapy,我正在尝试将目标文本放在标记中。还有一些标记也有嵌套的标记，我的XPATH没有针对这些标记的文本值链接：下面是我正在使用的XPATH://article//p/text（）当然，我可以do//article//p//text（）和目标文本，但这也会得到我不想提取的其他链接。我只想获取标记内的所有文本，如果有任何嵌套标记，也要获取该值我怎样才能达到这样的结果呢谢谢大家。由于大多数粉红色链接都以“学习”开头，我可能会这样说： a = response.xpath('//article//

我正在尝试将目标文本放在标记中。还有一些标记也有嵌套的标记，我的XPATH没有针对这些标记的文本值

链接：

下面是我正在使用的XPATH:

//article//p/text（）

当然，我可以

do//article//p//text（）

和目标文本，但这也会得到我不想提取的其他链接。我只想获取标记内的所有文本，如果有任何嵌套标记，也要获取该值

我怎样才能达到这样的结果呢

谢谢大家。

由于大多数粉红色链接都以“学习”开头，我可能会这样说：

a = response.xpath('//article//p//a//text()').extract()
if "Learn" not in a and "Back to top" not in a:
    print(response.xpath('//article//p/text()').extract())

我不确定你想提取什么。您编写了“我只想获取标记内部的所有文本，如果存在任何嵌套标记，也要获取该值”，因为该目标

//article//p/a//text（）

可以实现，但我认为这不是您想要的。从你的图片上看，你似乎不想看到

标签本身，只是那些混在文本中的标签，但你没有提到它。你能详细说明你想要选择什么和不想要什么吗？