Scrapy/Python:获取TR项的未知[index]
我得到了这个选择器:Scrapy/Python:获取TR项的未知[index],python,html,xpath,scrapy,scrapy-spider,Python,Html,Xpath,Scrapy,Scrapy Spider,我得到了这个选择器: sel = response.xpath('//table//tr[td[@class="ad73"]]') 这将返回位于页面不同位置的TR选择器列表 有没有办法知道每个TR的绝对索引号(从(//TABLE/TR开始),以便稍后在另一个函数中按顺序对其进行处理?我不太确定您在这里要做什么,但请注意: 紧接着这些TR之后是其他TR,其中包含我需要搜集的数据 我想说的是,你需要下面的兄弟姐妹魔法来实现它所说的: sel = response.xpath('//table//t
sel = response.xpath('//table//tr[td[@class="ad73"]]')
这将返回位于页面不同位置的TR选择器列表
有没有办法知道每个TR的绝对索引号(从(//TABLE/TR开始),以便稍后在另一个函数中按顺序对其进行处理?我不太确定您在这里要做什么,但请注意: 紧接着这些TR之后是其他TR,其中包含我需要搜集的数据 我想说的是,你需要
下面的兄弟姐妹魔法来实现它所说的:
sel = response.xpath('//table//tr[td[@class="ad73"]]/following-sibling::tr')
这将使您在您确定的目标之后获得以下tr
。我为什么要这样做?因为紧接着这些tr之后是其他tr,它们有数据,我需要清理,但它们没有任何类或唯一属性来定位它们谢谢您的回答,但这是针对Selenium的--我没有使用它(我还没有掌握scrapy),AFAIK Selenium是一个完全不同的框架。。。