Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scrapy/Python:获取TR项的未知[index]_Python_Html_Xpath_Scrapy_Scrapy Spider - Fatal编程技术网

Scrapy/Python:获取TR项的未知[index]

Scrapy/Python:获取TR项的未知[index],python,html,xpath,scrapy,scrapy-spider,Python,Html,Xpath,Scrapy,Scrapy Spider,我得到了这个选择器: sel = response.xpath('//table//tr[td[@class="ad73"]]') 这将返回位于页面不同位置的TR选择器列表 有没有办法知道每个TR的绝对索引号(从(//TABLE/TR开始),以便稍后在另一个函数中按顺序对其进行处理?我不太确定您在这里要做什么,但请注意: 紧接着这些TR之后是其他TR,其中包含我需要搜集的数据 我想说的是,你需要下面的兄弟姐妹魔法来实现它所说的: sel = response.xpath('//table//t

我得到了这个选择器:

sel = response.xpath('//table//tr[td[@class="ad73"]]')
这将返回位于页面不同位置的TR选择器列表


有没有办法知道每个TR的绝对索引号(从(//TABLE/TR开始),以便稍后在另一个函数中按顺序对其进行处理?

我不太确定您在这里要做什么,但请注意:

紧接着这些TR之后是其他TR,其中包含我需要搜集的数据

我想说的是,你需要
下面的兄弟姐妹
魔法来实现它所说的:

sel = response.xpath('//table//tr[td[@class="ad73"]]/following-sibling::tr')

这将使您在您确定的目标之后获得以下
tr

我为什么要这样做?因为紧接着这些tr之后是其他tr,它们有数据,我需要清理,但它们没有任何类或唯一属性来定位它们谢谢您的回答,但这是针对Selenium的--我没有使用它(我还没有掌握scrapy),AFAIK Selenium是一个完全不同的框架。。。