Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/290.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Scrapy shell-用于从表中获取信息的正确xpath选择器?_Python_Web Scraping_Scrapy_Scrapy Shell - Fatal编程技术网

Python Scrapy shell-用于从表中获取信息的正确xpath选择器?

Python Scrapy shell-用于从表中获取信息的正确xpath选择器?,python,web-scraping,scrapy,scrapy-shell,Python,Web Scraping,Scrapy,Scrapy Shell,我正在尝试获取正确的Xpath,用于提取下图中用红色圈出的信息: 我尝试过复制xpath并将其粘贴到scrapy shell,但它不起作用。我遇到了一些困难,因为信息包含在一个表中,表中的每个元素都有相同的名称。该网站是 假设要刮取的所有页面上的文本Marca都是常量。首先搜索包含文本“Marca”的b元素。如果它是td元素,则查找它的父元素。如果是td元素,则获取以下同级。获取其文本节点: response.xpath("//b[contains(text(),'Marca')]/

我正在尝试获取正确的Xpath,用于提取下图中用红色圈出的信息:

我尝试过复制xpath并将其粘贴到scrapy shell,但它不起作用。我遇到了一些困难,因为信息包含在一个表中,表中的每个元素都有相同的名称。该网站是


假设要刮取的所有页面上的文本
Marca
都是常量。首先搜索包含文本“Marca”的
b
元素。如果它是
td
元素,则查找它的父元素。如果是
td
元素,则获取以下同级。获取其文本节点:

response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()
否则,如果它始终是第四个
tr
元素的第二个
td
元素:

response.xpath("//tr[4]/td[2]/text()").get()
产出:

'RTA Design'