Scrapy/Python：获取TR项的未知[index]_Python_Html_Xpath_Scrapy_Scrapy Spider - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scrapy/Python：获取TR项的未知[index]_Python_Html_Xpath_Scrapy_Scrapy Spider - Fatal编程技术网

Scrapy/Python：获取TR项的未知[index]

python html xpath scrapy

Scrapy/Python：获取TR项的未知[index],python,html,xpath,scrapy,scrapy-spider,Python,Html,Xpath,Scrapy,Scrapy Spider,我得到了这个选择器： sel = response.xpath('//table//tr[td[@class="ad73"]]') 这将返回位于页面不同位置的TR选择器列表有没有办法知道每个TR的绝对索引号（从（//TABLE/TR开始），以便稍后在另一个函数中按顺序对其进行处理？我不太确定您在这里要做什么，但请注意：紧接着这些TR之后是其他TR，其中包含我需要搜集的数据我想说的是，你需要下面的兄弟姐妹魔法来实现它所说的： sel = response.xpath('//table//t

我得到了这个选择器：

sel = response.xpath('//table//tr[td[@class="ad73"]]')

这将返回位于页面不同位置的TR选择器列表

有没有办法知道每个TR的绝对索引号（从（//TABLE/TR开始），以便稍后在另一个函数中按顺序对其进行处理？

我不太确定您在这里要做什么，但请注意：

紧接着这些TR之后是其他TR，其中包含我需要搜集的数据

我想说的是，你需要

下面的兄弟姐妹魔法来实现它所说的：
sel = response.xpath('//table//tr[td[@class="ad73"]]/following-sibling::tr')

这将使您在您确定的目标之后获得以下tr
。
我为什么要这样做？因为紧接着这些tr之后是其他tr，它们有数据，我需要清理，但它们没有任何类或唯一属性来定位它们谢谢您的回答，但这是针对Selenium的--我没有使用它（我还没有掌握scrapy），AFAIK Selenium是一个完全不同的框架。。。




[html]相关文章推荐



                                                        
Html 使用CSS在div中缩放和重新定位图像？
htmlcss 
HTML文本输入插件，用于CSV数据保留列对齐？
htmlcsvtabs 
HTML-如何在一个页面上高效地执行多个类似Facebook的按钮
htmlfacebook 
Html 如何使用固定的“"；“导航”；
htmlcss 
Html 带有已定义css类的导航菜单，在向li标记添加ID属性时中断
htmlcss 
Html 如果最后一个li是链接，则最后一个子选择器不工作
htmlcss 
Html 文本有边距，但没有给出边距
htmlcss 
Html 加载不同的内联图像以获得更小的屏幕分辨率
htmlcssresponsive-design 
Html Rails和Bootstrap3：如何在同一行中获得名字和姓氏？
htmlruby-on-railstwitter-bootstrap-3 
无法设置HTML下拉选择选项
htmljspservlets 
Html 负利润和源订单
htmlcss 
Html CSS列表样式和文本装饰没有效果
htmlcss 
Html 为什么iphone5的屏幕会减半？
htmliphone 
Html 引导链接颜色
htmlcss 
Html Div未延伸至车身顶部
htmlcss 
Html 如何在css中删除ul和div之间的空格
htmlcss 
Html 而不是在单击按钮后直接在下方显示内容
htmlbutton 
Html 从搜索按钮上的表中搜索用户单击-Angular JS
htmlangularjs 
如何完全删除HTML表格边框？
htmlcss 
Html 引导导航交互式小报左侧和右侧
htmlcsstwitter-bootstrapbootstrap-4 
                                       





随机文章推荐



                                                        
获取INSERT'的行计数；根据mysqldump中的表名-awk、sed、grep
sedawkgrep 
Sed 交换数字
sedawk 
使用awk-sed进行文件列操作
sedawk 
如何使用sed查找和替换除第一个匹配项之外的所有匹配项？
sed 
带sed的翻转数组索引
sed 
Sed 经济及社会发展局局长：；重复运算符操作数无效"；使用捕获组
sed 
使用sed替换现有线路中的阵列
sed 
Sed 如何根据找到的图案获得特定线条
sedawk 
使用sed在字符前或新行插入文本？
sedlatex 
Sed 将一个文本行更改为多个文本行
sed 
Sed Bash使用下划线重命名文件
sed 
Sed 更改ASCII文件中精确滚动的精确单词
sedgrep 
sed:-e表达式#1，char 62：未知命令：`'；
sed 
sed匹配第一个单词替换整行
sed 
SED{命令失败
sed 
这个sed命令是如何工作的？。。。。。。sed-E'；s/（^-]）-（[^-]$）/\1xx\2/g'；
sed 
Sed表达式是否匹配此多行代码？
sed 
Sed 如何替换定长字母数字字符？
sed 
Sed删除由包含关键字的行指示的MAC地址
sed 
如何删除所有字母，直到第一个数字出现sed？
sed


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Sails.js
Programming Languages
Migration
View
Xamarin.forms
Maven
Uitableview
Sms
Jaxb
Docker Compose
Apache Zookeeper
Typescript
Here Api
Magento2
Oauth
Cookies
Checkbox
Asp.net Core Mvc
Woocommerce
Pycharm
Notifications
Sapui5
Protractor
Talend
Ip
Opencart
Browser
Dotnetnuke
Xslt
Rust
Authentication
Dependency Injection
Clearcase
Cypress
Cron
Vaadin
Generics
Salesforce
Jdbc
Login
Mqtt
Zurb Foundation
Signalr
Redirect
Ios6
Canvas
Electron
Plugins
Isabelle
Uwp
Wso2
Sass
Time
Playframework
Python
Cryptography
Yii2
Groovy
Openlayers
Nosql
Proxy
Azure Sql Database
Google Plus
Coffeescript
Date
Java
Xaml
Cakephp
Paypal
File
Ios4
Text
Markdown
Sugarcrm
Stata
Neo4j
Image Processing
Stm32
Erlang
Error Handling
Jakarta Ee
Exchange Server
Xmpp
Visual C++
Jquery Mobile
Cocoa Touch
Ubuntu
Curl
Bash
Air
Aws Lambda
Modelica
Sharepoint
Windows Phone 7
Xcode4
Pagination
Teradata
Netbeans
Linux Kernel
Windows Phone 8
Google Cloud Dataflow
Maven 2
Optimization
Apache Spark
Server
Drop Down Menu
Ada
Sql Server 2008 R2
Opengl
Silverlight 4.0
Hash
Map
Hadoop
Javascript
Sdk
Antlr
Couchbase
Cucumber
Directx
Youtube
Omnet++
Apache
Cuda
Sap
Forms
Bots
Iframe
Routing
Version Control
Hyperledger Fabric
File Io
Chef Infra
Validation
Automated Tests
Acumatica
Bison
Timer
Android Layout
Perforce
Testng
Next.js
Ms Office
Eclipse Rcp
Asterisk
Raspberry Pi
Excel
Nest
Ipad
Vb.net
Jasmine
Zsh
Concurrency
Jwt
Google Compute Engine
Mongoose
Spring Security
Servlets
Adobe
Odata
Xamarin.ios
Hibernate
Recursion
Layout
Dom
Javafx
Windows Services
Keras
Html
Libgdx
Clojure
Algorithm
Tkinter
Parsing
Go
Synchronization
Compiler Errors
Shiny
Silverstripe
Heroku
Google Cloud Firestore
Flash
Laravel
Identityserver4
Llvm
Leaflet
Bootstrap 4
Bluetooth
Iis 7
Combobox
Encoding
Uiview
Sed
Docusignapi
Apache Pig
Button
.htaccess
Ios
Scikit Learn
Routes
Batch File
Plsql


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网