Python Scrapy shell-用于从表中获取信息的正确xpath选择器？_Python_Web Scraping_Scrapy_Scrapy Shell

Python Scrapy shell-用于从表中获取信息的正确xpath选择器？

python web-scraping scrapy

Python Scrapy shell-用于从表中获取信息的正确xpath选择器？,python,web-scraping,scrapy,scrapy-shell,Python,Web Scraping,Scrapy,Scrapy Shell,我正在尝试获取正确的Xpath，用于提取下图中用红色圈出的信息：我尝试过复制xpath并将其粘贴到scrapy shell，但它不起作用。我遇到了一些困难，因为信息包含在一个表中，表中的每个元素都有相同的名称。该网站是假设要刮取的所有页面上的文本Marca都是常量。首先搜索包含文本“Marca”的b元素。如果它是td元素，则查找它的父元素。如果是td元素，则获取以下同级。获取其文本节点： response.xpath("//b[contains(text(),'Marca')]/

我正在尝试获取正确的Xpath，用于提取下图中用红色圈出的信息：

我尝试过复制xpath并将其粘贴到scrapy shell，但它不起作用。我遇到了一些困难，因为信息包含在一个表中，表中的每个元素都有相同的名称。该网站是

假设要刮取的所有页面上的文本

Marca

都是常量。首先搜索包含文本“Marca”的

元素。如果它是

td

元素，则查找它的父元素。如果是

td

元素，则获取以下同级。获取其文本节点：

response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()

否则，如果它始终是第四个

tr

元素的第二个

td

元素：

response.xpath("//tr[4]/td[2]/text()").get()

产出：

'RTA Design'