Python Scrapy shell-用于从表中获取信息的正确xpath选择器?
我正在尝试获取正确的Xpath,用于提取下图中用红色圈出的信息: 我尝试过复制xpath并将其粘贴到scrapy shell,但它不起作用。我遇到了一些困难,因为信息包含在一个表中,表中的每个元素都有相同的名称。该网站是Python Scrapy shell-用于从表中获取信息的正确xpath选择器?,python,web-scraping,scrapy,scrapy-shell,Python,Web Scraping,Scrapy,Scrapy Shell,我正在尝试获取正确的Xpath,用于提取下图中用红色圈出的信息: 我尝试过复制xpath并将其粘贴到scrapy shell,但它不起作用。我遇到了一些困难,因为信息包含在一个表中,表中的每个元素都有相同的名称。该网站是 假设要刮取的所有页面上的文本Marca都是常量。首先搜索包含文本“Marca”的b元素。如果它是td元素,则查找它的父元素。如果是td元素,则获取以下同级。获取其文本节点: response.xpath("//b[contains(text(),'Marca')]/
假设要刮取的所有页面上的文本
Marca
都是常量。首先搜索包含文本“Marca”的b
元素。如果它是td
元素,则查找它的父元素。如果是td
元素,则获取以下同级。获取其文本节点:
response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()
否则,如果它始终是第四个tr
元素的第二个td
元素:
response.xpath("//tr[4]/td[2]/text()").get()
产出:
'RTA Design'