Python:Xpath问题为for循环中的每个DIV获取值_Python_Python 3.x_Xpath - Fatal编程技术网

Python:Xpath问题为for循环中的每个DIV获取值

python python-3.x xpath

Python:Xpath问题为for循环中的每个DIV获取值,python,python-3.x,xpath,Python,Python 3.x,Xpath,我使用Python3.6来处理一大块HTML，我遇到的问题是下面的循环代码正在工作，但是atag.xpath查询正在搜索整个HTML源代码，并返回数据大小的所有四个标记值我试图做的是，当为for循环处理PAGE\u RAW时，对于包含项类的DIV的每个实例，它将找到具有填充类的子DIV，并拉出该标记的数据大小属性，如果在HTML源代码 HTML <div class="item"> <div class="padding" data-size="12"><

我使用Python3.6来处理一大块HTML，我遇到的问题是下面的循环代码正在工作，但是

atag.xpath

查询正在搜索整个HTML源代码，并返回

数据大小的所有四个标记值
我试图做的是，当为for
循环处理PAGE\u RAW
时，对于包含项类的DIV的每个实例，它将找到具有填充类的子DIV
，并拉出该标记的数据大小
属性，如果在HTML源代码
HTML
<div class="item">
    <div class="padding" data-size="12"></div>
</div>
<div class="item">
    <div class="padding" data-size="13"></div>
</div>
<div class="item">
    <div class="padding" data-size="14"></div>
</div>
<div class="item">
    <div class="padding" data-size="15"></div>
</div>

这里面临的问题是，在第二个xpath中，/
告诉它在文档中的任何地方搜索（不管当前节点是否是特定的div
，它总是从一开始就搜索）
若要查找当前节点下的任何节点，请将/
替换为/
（
指示搜索从当前节点开始，而不是从根节点开始）
/
和/
之间有什么区别？或者有什么区别吗？虽然//
将匹配任何后代（或自身），/将只匹配子代。请查看第二个答案，解释得很清楚：
import lxml.html as LH
...

PAGE_RAW = driver.page_source
PAGE_RAW = LH.fromstring(PAGE_RAW)

for atag in PAGE_RAW.xpath("//div[contains(@class, 'item')]"):
    data = atag.xpath("//div[contains(@class, 'padding')]/@data-size")

import lxml.html as LH
...

PAGE_RAW = driver.page_source
PAGE_RAW = LH.fromstring(PAGE_RAW)

for atag in PAGE_RAW.xpath("//div[contains(@class, 'item')]"):
    data = atag.xpath(".//div[contains(@class, 'padding')]/@data-size")




[python 3.x]相关文章推荐



                                                        
Python 3.x Python范围（再次）
python-3.x 
Python 3.x PyInstaller不包括依赖项文件
python-3.x 
Python 3.x 将在for循环中创建的tkinter单选按钮重置为默认值
python-3.xtkinter 
Python 3.x Can'；t添加matplotlib颜色条记号
python-3.xmatplotlib 
Python 3.x 爬网程序正在跳过第一页的内容
python-3.xweb-scrapingweb-crawler 
Python 3.x 来自生成器的Python字节对象
python-3.x 
Python 3.x 无法将py2neo v3与neo4j 3.4.1连接
python-3.xneo4j 
Python 3.x 复制和格式化子目录
python-3.xdictionary 
Python 3.x 从<；中提取href后获取#；a>；标签
python-3.xweb-scraping 
Python 3.x 为什么Python3中max（list，key）和max（set（list，key）的结果不同？
python-3.xlist 
Python 3.x TypeError:参数类型为'；邮寄'；这是不可容忍的
python-3.xflask 
Python 3.x 如何优化以避免使用过多‘；如果’‘；elif’‘；其他’；语句并有效降低圈复杂度？
python-3.x 
Python 3.x 按已在另一个数据帧中出现的值筛选数据帧
python-3.xpandas 
Python 3.x Boto3脚本删除所有未标记的图像
python-3.x 
Python 3.x 如何将datetime列的格式设置为相同的格式
python-3.xpandasdatetime 
Python 3.x 如何使用输出绘制频率图？
python-3.xpandas 
Python 3.x RaspBerry Pi 4+；上带有PyGame的音频cdrom没有声音；，使用ALSA
python-3.xaudioraspberry-pi 
Python 3.x BrowserMobProxy:ConnectionRefusedError:[WinError 10061]在系统重新启动后
python-3.x 
Python 3.x 重新排列数据帧
python-3.xpandas 
Python 3.x 导入模块在生成uu pycache uuu后停止工作
python-3.x 
                                       





随机文章推荐



                                                        
Merge 同时修改my MediaWiki的各个部分总是会导致冲突
mergemediawiki 
Merge Perforce如何处理合并/集成后但提交前所做的更改？
mergeperforce 
Merge Xssf合并查询
merge 
Merge 如何在ImageJ中将不同的堆栈合并在一起？
merge 
Merge （opencv）将等高线合并在一起
merge 
Merge 在dataframe中合并两列
merge 
Merge 基于区间合并两个数据集
merge 
Merge RxJs如何将两个重叠的可观察对象合并为一个
mergerxjs 
Merge 如何在ruamel.yaml中将一个属性引用更改为锚点
merge


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 需要支持调试吗
									Python
							 									Debugging
							 
Python Django模板中未显示图像
									Python
							 									Django
							 									Image
							 
Python 字典属性的正则表达式
									Python
							 									Regex
							 
Python 从一个模块调用另一个模块中的类函数
									Python
							 									Tkinter
							 
我应该如何用Python包装交互式子流程（如shell）
									Python
							 									Shell
							 
如何让Python使用查询搜索调用文件名？
									Python
							 									File
							 
如何使用Python BeautifulSoup从特定html类中获取href
									Python
							 
Python 有没有办法检测文件读取？
									Python
							 									Io
							 
Python 如何使用pypy导入bitarray？
									Python
							 
Python 图中的独立集检查是一个团
									Python
							 
在Python和Matplotlib中为三维绘图添加不同的着色
									Python
							 									Graph
							 									Matplotlib
							 									Plot
							 
Python 将经过pickle处理的数组拆分为单独的变量？
									Python
							 									Arrays
							 
Python 在Django中导入模块（新手）
									Python
							 									Django
							 
在Python中，动态写入csv文件是否比附加到数组慢？
									Python
							 									Csv
							 									Dynamic
							 
使用Python将文件附加到Access数据库中
									Python
							 									Ms Access
							 
Python 我如何在（）中进行选择
									Python
							 									Pandas
							 
Python Flask无法将对象添加到会话中
									Python
							 									Flask
							 
Python Pygame跳过按键检查
									Python
							 
Python 允许移动列，但在未移动列为空的位置添加新行
									Python
							 									Pandas
							 
Python ValueError:检查目标时出错：预期密集_44具有形状（1，），但获得具有形状（3，）的数组。不过他们看起来很般配
									Python
							 									Tensorflow
							 									Keras
							 
Python Pad_序列为max_len（Keras）获取多个参数
									Python
							 									Keras
							 
Python 在运行时更改管理类
									Python
							 									Django
							 
Python ModuleNotFoundError:没有名为'；国际奥委会'；在TFlearn图像分类中
									Python
							 									Deep Learning
							 
Python 从N乘1浮点型矩阵到N列表的转换
									Python
							 									Numpy
							 
Python 我是否应该添加一个else语句来尝试使用except块来处理return语句？
									Python
							 									If Statement
							 
Python 创建函数以过滤和计算基于过滤器的行划分？
									Python
							 									Python 3.x
							 									Pandas
							 									Function
							 
有没有办法在python中运行R代码（使用cran和github的包）？
									Python
							 									R
							 
Python 为什么Tensorflow中的逻辑回归分类器没有学习？
									Python
							 									Tensorflow
							 									Machine Learning
							 
Python 使用列表理解功能将项目多次添加到列表中
									Python
							 									Python 3.x
							 
Python 读取excel文件时出现Pandas和xlrd错误
									Python
							 									Excel
							 									Pandas
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Abap
Matplotlib
Scala
Text
Apache Camel
Jira
Statistics
Spring
Visual Studio Code
Memory Leaks
Web
Wso2
Qt4
Sql Server 2008
Dynamic
Authentication
Migration
Version Control
Glassfish
Cloud
Routes
Dask
Ibm Mobilefirst
Azure Devops
Azure Data Factory
Post
Charts
Dictionary
.net
Breeze
Entity Framework
Gulp
Events
Com
Hadoop
Jestjs
Shopify
Shell
D
Blackberry
Fluent Nhibernate
Github
Postgresql
Rest
Performance
Pyspark
Discord.js
Ipython
Xamarin.forms
Video Streaming
Editor
Twitter
Keyboard
Tkinter
Azure Service Fabric
Jsp
Join
Cocos2d Iphone
Artifactory
Office Js
Xaml
Multithreading
Google Colaboratory
Laravel 4
Antlr4
D3.js
Ruby On Rails 3.2
Salesforce
Wpf
Ssas
Doxygen
Login
Http
Neural Network
Gcc
Ruby
Browser
Parsing
Nlp
Character Encoding
Mpi
Rally
Qml
Debugging
Shiny
Ibm Midrange
Objective C
Web Applications
Nuget
Coding Style
Knockout.js
Nest
Tsql
Cocos2d X
Scripting
Wcf
Dialogflow Es
Plugins
Hibernate
Windows 8
Snmp
Awk
Fullcalendar
Facebook
Modelica
Arrays
Core Data
Netlogo
Leaflet
Akka
Odata
Embedded
Wix
Junit
Android Studio
Linq
Qt
Chef Infra
Playframework 2.0
Hive
Google App Engine
Flash
Google Maps Api 3
Transactions
Ldap
Cluster Computing
Visual Studio 2013
Notifications
Openstack
Database
Clojure
Git
Design Patterns
Opencart
Doctrine
Subsonic
Stream
Mdx
Biztalk
Wxpython
Microservices
Spotify
Websphere
Struct
Julia
Twitter Bootstrap 3
Cors
Serialization
Kubernetes
Activerecord
Ionic Framework
Import
Gtk
Sharepoint 2007
Computer Science
Microsoft Graph Api
Winapi
Datetime
Machine Learning
Speech Recognition
Apache Pig
Nginx
Material Ui
Encryption
Error Handling
Network Programming
Lua
Racket
Pandas
File Io
Powershell
Geolocation
Meteor
Actionscript
Eclipse Rcp
Sprite Kit
Plsql
Makefile
Blazor
Smalltalk
Jakarta Ee
Tinymce
Listview
Io
Google Analytics
Prolog
Sql Server 2008 R2
Django
Tcl
Mercurial
Openlayers 3
Amazon S3
Module
Drop Down Menu
Architecture
Xpath
Autocomplete
Open Source
X86
Protocol Buffers
Passwords


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网