Python使用lxml解析来自站点的数据_Python_Parsing_Python 2.7_Lxml - Fatal编程技术网

Python使用lxml解析来自站点的数据

python parsing python-2.7

Python使用lxml解析来自站点的数据,python,parsing,python-2.7,lxml,Python,Parsing,Python 2.7,Lxml,我是Python新手。这就是我请求帮助的原因。我需要解析来自站点的ssome数据。我正在使用Python 2.7。这是我的代码： import urllib import lxml.html url = 'http://www.pogoda.YANDEX.RU/MOSCOW' sock = urllib.urlopen(url) content = sock.read() pageReady = u'content.decode()' page = urllib.urlopen('http

我是Python新手。这就是我请求帮助的原因。我需要解析来自站点的ssome数据。我正在使用Python 2.7。这是我的代码：

import urllib
import lxml.html

url = 'http://www.pogoda.YANDEX.RU/MOSCOW'
sock = urllib.urlopen(url)
content = sock.read()
pageReady = u'content.decode()'
page = urllib.urlopen('http://pogoda.yandex.ru/moscow/')
xmldata = lxml.html.document_fromstring(pageReady)
temperature = xmldata.xpath('//div[@class="b-thermometer__now"]/text()')              
clouds = xmldata.xpath('//div[@class="b-info-item b-info-item_type_fact-big"]/text()')
sock.close()

print('%s, %s'%(temperature[0], clouds[0]))

所以我得到了下一条信息：

File "weather.py", line 15, in <module> print('%s, %s'%(temperature[0], clouds[0])) 
IndexError: list index out of range

文件“weather.py”，第15行，打印（“%s，%s%”（温度[0]，云[0]））
索引器：列表索引超出范围
这是因为您的温度和云是空列表。
只包含内容。decode（）
作为其内容，因为以下行：
pageReady = u'content.decode()'

您应该使用page.read（）
获取网页内容，如下所示：
import urllib
import lxml.html

# pageReady = u'content.decode()'   <----------- Remove/comment out this line.
page = urllib.urlopen('http://pogoda.yandex.ru/moscow/')
pageReady = page.read()   # <-------------------------------
xmldata = lxml.html.document_fromstring(pageReady)
temperature = xmldata.xpath('//div[@class="b-thermometer__now"]/text()')              
clouds = xmldata.xpath('//div[@class="b-info-item b-info-item_type_fact-big"]/text()')
page.close()

print('%s, %s'%(temperature[0], clouds[0])) 

导入urllib
导入lxml.html
#pageReady=u'content.decode（）'可能比解析为人类提供的html更健壮。




[parsing]相关文章推荐



                                                        
Parsing 耶尔瓦尔与联合
parsingbison 
Parsing 你能修改这个BNF语法，使它总是包含奇数只狗吗？
parsingsyntax 
Parsing Cmdarg是否可以在子模式之外具有标志？
parsinghaskellcommand-line 
Parsing 构建解析器的选项
parsingdynamicprogramming-languages 
Parsing 是否有设计用于测试解析代码路径的OpenType字体文件？
parsingfonts 
Parsing 解析aws cloudfront日志
parsing 
Parsing 整数字符串分析器
parsing 
Parsing 如何格式化要求两个标记相等的语法规则？
parsing 
Parsing 左递归解析
说明：
parsingrecursioncompiler-construction 
Parsing 用Parsec解析非二进制运算符
parsinghaskell 
Parsing 如果两个ANTLR4标记的文本相同，如何区分它们？
parsingantlrantlr4 
Parsing 在Haskell（Trifecta）中解析三位数的最简洁方法
parsinghaskell 
Parsing 为什么会出现此错误，如何修复
parsingbison 
Parsing 如果您可以组合3+；任意大小的整数，仍然能够解构它回来
parsinghash 
Parsing 获取表达式'；s在正在分析的文本中的位置和长度
parsingantlrantlr4 
Parsing 从单个div中的多个span标记获取文本，但不包含其他区分信息
parsingtags 
Parsing 解析过程调用玩具语言
parsingcompiler-construction 
Parsing 如何简化递归下降解析器？
parsingcompiler-construction 
Parsing 如何跨模型实例定义碰撞过滤器组？
parsing 
Parsing 自顶向下递归分析器的语法无效
parsing 
                                       





随机文章推荐



                                                        
XAML组合框选择已更改加载时激发
xaml 
Xaml C#/ConstructorParameter属性
xamlparameters 
Xaml 如何根据值绑定数据？
xaml 
Xaml 我可以使自定义gridviewitem独立于我的collectionviewsource吗？
xamlgridviewwindows-runtime 
用xaml在longlistselector中编写阿拉伯语文本
xamlwindows-phone-8 
Xaml 在PhoneApplicationPage windows phone 8中实现类似Pivot页的滑动动画
xamlwindows-phone-7windows-phone-8 
使用XAML在LongListSelector上添加选定效果
xamlwindows-phone-8 
Xaml 使用tf.exe自动签入失败，TFS策略失败
xamltfsbuild 
xaml布局文件赢得'；t链接到Resource.resw中的字符串
xamlwindows-phone-8.1 
Xaml panaroma应用程序中的图像未显示在网格上
xamlwindows-phone-8 
在UWP应用程序中重写Generic.xaml中的资源
xamluwp 
Xaml ListView MVVM中文本框上的UWP InvokeCommandAction
xamlmvvmdata-binding 
Xaml 带转换器参数的UWP多重绑定
xamlwindows-phone-8.1uwp 
如何在基于xaml的xamarin forms视图类中绑定到它
xamlxamarin.forms 
Xaml 在xamarin表单中实现可重用元素
xamlxamarin.forms 
Xaml xamarin表单中输入透明属性的OnPlatform
xamlxamarin.forms 
Xaml x：数据类型can'；无法解决
xamluwp 
Xaml 显示与Xamarin.Forms Previewer不同输出的模拟器
xamlxamarinxamarin.formsandroid-emulator 
XAML'；s鼠标悬停触发器'；s当触摸UI元素的边缘时，进入/退出操作无限循环
xaml 
Xaml 以十六进制代码表示的Alpha通道在99%时仍然很漂亮”；看穿；
xamlxamarin.forms


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python Django身份验证似乎总是返回none
									Python
							 									Django
							 									Authentication
							 
Python、PyCharm和Windows中的UDP大数据包碎片
									Python
							 									Sockets
							 									Networking
							 
Python input（）错误-NameError:name''；没有定义
									Python
							 									Python 2.7
							 									Input
							 
Python 将类作为列表和字典进行索引
									Python
							 									List
							 									Dictionary
							 									Pandas
							 
Python 创建解析器代码
									Python
							 									Json
							 
Python jinja2：使用全局变量选择文本块
									Python
							 									Latex
							 
Python ImportError:DLL加载失败：应用程序无法启动，因为其并行配置不正确
									Python
							 									Import
							 
python中提要和列表的区别
									Python
							 									Tensorflow
							 
Python SQLAlchemy查询性能与2个过滤器非常慢
									Python
							 									Mysql
							 									Sqlalchemy
							 
如何在python请求库中设置POST请求的内容类型？
									Python
							 
Python 在Scapy中添加icmp类型会停止代码工作
									Python
							 
如何在python中使用不同的返回值运行多个函数
									Python
							 
Python orderedContent PyXB返回空列表
									Python
							 									Xml
							 									Python 3.x
							 									Python 2.7
							 
Can'；t安装Python软件包
									Python
							 									Python 2.7
							 									Ssl
							 									Openssl
							 
Python 如何使用tensorflow处理嵌套循环？
									Python
							 									Tensorflow
							 									Keras
							 
Python 仿射变换后不同高度的字母
									Python
							 									Matplotlib
							 
如何在Python中对复制的MagicMock调用方法？
									Python
							 									Testing
							 
Python 使用matplotlib为水平条形图创建替代y轴标签
									Python
							 									Matplotlib
							 
Python 从刮痕上刮下产品，然后分页
									Python
							 									Xpath
							 									Scrapy
							 
Python PyOpenGL:glutTimerFunc回调缺少必需的参数'；价值'；
									Python
							 									Python 3.x
							 									Opengl
							 
Python 使用statsmodels（SARIMAX）同时进行多系列预测
									Python
							 
Python “错误”；将字符串转换为浮点；使用model.predict（）时
									Python
							 									Pandas
							 									Dataframe
							 									Scikit Learn
							 
Python 读取带有转义字符的csv
									Python
							 									Pandas
							 									Csv
							 
Python 如何修复文本文件的解析？
									Python
							 
Python 是否有内置容器映射int->；元素？
									Python
							 									Dictionary
							 									Optimization
							 
Python DRF create API中多对多场的问题
									Python
							 									Django
							 									Python 3.x
							 									Django Rest Framework
							 
使用python的Azure下游设备到边缘网关
									Python
							 									Azure
							 
Python 保存输入并要求在重新启动程序时再次使用
									Python
							 									Python 3.x
							 									Authentication
							 									Input
							 									Passwords
							 
通过Python中的librosa.start.detect删除声音蜂鸣检测中的偏移量
									Python
							 									Audio
							 
Python 部署在自定义OpenAI健身房环境上训练的DeepRL模型
									Python
							 									Deployment
							 									Deep Learning
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
C# 4.0
Servlets
Windows Installer
Tinymce
Ubuntu
Linker
Cors
Dom
Antlr4
Ecmascript 6
Knockout.js
Socket.io
Cypress
Swift3
Smtp
Asp.net Mvc
Activemq
Sencha Touch 2
Replace
Linux
Process
Sip
Jira
Floating Point
Netlogo
Kubernetes
Node.js
Xml
Join
Authentication
Cloud
Material Ui
Pip
Opengl
Spring Cloud
Wpf
Prometheus
Iphone
Air
Gremlin
Three.js
Io
Swift2
Rabbitmq
Scikit Learn
Glassfish
Office365
Random
Smalltalk
Class
Html
Spring Batch
Plsql
Actionscript 3
Calendar
Kernel
Amp Html
Jmeter
Selenium Webdriver
Coffeescript
Quickbooks
File Io
.net 4.0
Validation
Concurrency
Optimization
Javafx
Core Data
Ip
Virtual Machine
Forms
Cassandra
Graphql
Recursion
Filter
Azure Data Factory
Ibm Mq
Pagination
Uitableview
Mapbox
Log4net
Verilog
Clojure
Tsql
Appium
Intellij Idea
Sms
Gwt
Mongodb
Syntax
Bazel
Interface
Akka
Visual C++
Indexing
Logstash
Eclipse Plugin
Pytorch
Jar
Haskell
Merge
Acumatica
Amazon Redshift
Go
Programming Languages
Microservices
Raspberry Pi
Grid
Eclipse
Service
Meteor
Cocoa Touch
Windows Store Apps
Discord.js
Pandas
Continuous Integration
Fiware
Nestjs
Seo
Configuration
Windows Runtime
Groovy
Vue.js
Internet Explorer
Applescript
Silverlight
Serialization
Umbraco
Google Bigquery
Sitecore
Office Js
Orientdb
Winapi
For Loop
Input
Openerp
Unix
Ipython
Nhibernate
Gmail
Directx
Airflow
Svn
Google Cloud Dataflow
Url
Ssh
Report
Rx Java
Version Control
C#
Blockchain
Hive
Ibm Midrange
Memory
Laravel 5
Erlang
Time
Terminal
Razor
Regex
Character Encoding
Keras
Variables
Jpa
Python 2.7
Axapta
Imagemagick
Data Binding
Computer Vision
Typescript
Prestashop
View
Java Me
Tomcat
Cmake
Xamarin.ios
Design Patterns
Jwt
Openlayers 3
Rss
Twitter
Iis
Mapping
Llvm
Loops
Url Rewriting
Sas
Xamarin.forms
Cron
Xpath
Tridion
Angular
Dns
Fullcalendar
Asp.net Mvc 5
Maven 2
Dependency Injection
Azure Sql Database
Events
Enums
Vagrant


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网