使用xpath和python获取文本值_Python_Python 3.x_Xpath_Web Scraping - Fatal编程技术网

使用xpath和python获取文本值

python python-3.x xpath web-scraping

使用xpath和python获取文本值,python,python-3.x,xpath,web-scraping,Python,Python 3.x,Xpath,Web Scraping,这是我写的代码。我正试着从你那里得到2758.82的字符串。但我得到的是 from lxml import html import requests url = 'https://www.bloomberg.com/quote/SPX:IND' page = requests.get(url) tree = html.fromstring(page.content) num = tree.xpath('//*[@id="root"]/div/div/section[2]/div[1]/div/s

这是我写的代码。我正试着从你那里得到2758.82的字符串。但我得到的是

from lxml import html
import requests
url = 'https://www.bloomberg.com/quote/SPX:IND'
page = requests.get(url)
tree = html.fromstring(page.content)
num = tree.xpath('//*[@id="root"]/div/div/section[2]/div[1]/div/section[1]/section/section[2]/section/div[1]/span[1]/text()')
print (num)

我从网站上复制了该部分的xpath。我在这里看到过类似的问题，但它们没有帮助。我的代码有问题吗？

这与xpath无关。这是关于页面是如何生成的

如果您检查

页面的内容。content

您将看到网页的源代码中没有

。这是因为HTML内容主要是通过Javascript生成的

但这并不能阻止您，如果您打开原始html源代码（从

page.content

）并查找所需的值（2759.81），您将发现一个标记：

和另一个

2759.81

，您可以使用其中一个：

[]

给予

这与xpath无关。这是关于页面是如何生成的

如果您检查

页面的内容。content

您将看到网页的源代码中没有

。这是因为HTML内容主要是通过Javascript生成的

但这并不能阻止您，如果您打开原始html源代码（从

page.content

）并查找所需的值（2759.81），您将发现一个标记：

和另一个

2759.81

，您可以使用其中一个：

[]

给予

谢谢您所说的“来自

页面内容”是什么意思？我应该在实际的页面源代码中查找
？因为当我打印page.content
时，我得到一些未对齐的HTML文本，在那里我找不到
。。还有…当我尝试执行你建议的代码时…我得到索引器：列表索引超出范围
谢谢！！。。您所说的“来自页面内容”是什么意思？我应该在实际的页面源代码中查找
？因为当我打印page.content
时，我得到一些未对齐的HTML文本，在那里我找不到
。。还有…当我尝试执行你建议的代码时…如果你仍然没有得到你建议解析的数字，我会得到索引器：列表索引超出范围
，除了@Arount已经提出的建议之外，您还需要做一件事。您需要定义一个标题，如requests.get（url，headers={“用户代理”：“Mozilla/5.0”}）
以使您的刮板更像人。谢谢！！它现在正在工作。还有一件事..我如何访问一些文本。
如果
也有一些属性呢？如果你想使用可见标记，请尝试使用selenium，它可以让你解析任何你想抓取的项目，考虑到它们的可见形式。如果你仍然没有得到你建议解析的数字，除了@Arount已经提出的建议之外，您还需要做一件事。您需要定义一个标题，如requests.get（url，headers={“用户代理”：“Mozilla/5.0”}）
以使您的刮板更像人。谢谢！！它现在正在工作。还有一件事..我如何访问一些文本。
如果也有一些属性呢？如果你想使用可见标记，请尝试使用selenium，它可以让你解析任何你想抓取的项目，考虑到它们的可见形式。
2759.82




[python 3.x]相关文章推荐



                                                        
Python 3.x 使用Python重命名目录中的一组文件时出现问题
python-3.x 
Python 3.x 用户输入中断while循环？
python-3.x 
Python 3.x 如何仅使用min（）和max（）对4个整数进行排序？python
python-3.x 
Python 3.x 如何在linux ubuntu 16.04上使用Anaconda 3和2？
python-3.xanaconda 
Python 3.x IPython生成的图形不正确
python-3.xnumpymatplotlib 
Python 3.x Anaconda:Datareader-未找到模块
python-3.xanaconda 
Python 3.x 在networkx中导入数据
python-3.x 
Python 3.x Python类型错误？
python-3.x 
Python 3.x Pygame：静态变量和实例变量
python-3.x 
Python 3.x 在不使用函数的情况下，如何计算包含非数字行索引和空值的多列数据帧的第25个百分位？
python-3.xpandasnumpydataframejupyter-notebook 
Python 3.x 使用Pytorch和Matplotlib时无法识别NVIDIA驱动程序
python-3.xmatplotlibpytorch 
Python 3.x 在Linux上安装ovirt engine sdk python失败，出现致命错误：libxml/xmlreader.h:没有此类文件或目录
python-3.xoracle 
Python 3.x 蟒蛇3从循环中断裂
python-3.xfor-loop 
Python 3.x 如何在一行python中编写If else
python-3.x 
Python 3.x 如何筛选Series.split（）返回的序列中的列表项
python-3.xpandas 
Python 3.x 如何在列表中搜索列表并合计金额和平均值
python-3.x 
Python 3.x 在表中输出数字。python
python-3.x 
Python 3.x 在执行期间从scrapy中计算刮取的项目，并在一定页数后暂停或休眠
python-3.xscrapy 
Python 3.x 有人知道如何将这个多项式编码成python吗？
python-3.x 
Python 3.x 向同一方向绘图移动子地块
python-3.x 
                                       





随机文章推荐



                                                        
Dynamics crm 在MS CRM 4.0中创建动态实体
dynamics-crm 
Dynamics crm Microsoft CRM 4.0发布：如何自定义收件人？
dynamics-crm 
Dynamics crm MS CRM可以'；在数据库还原后，不能添加用户
dynamics-crm 
Dynamics crm Dynamics CRM：使用特定的GUI创建用户
dynamics-crm 
Dynamics crm 将客户查找限制为联系人错误
dynamics-crm 
Dynamics crm Dynamics CreateEntityRequest-将实体指定给显示区域
dynamics-crm 
Dynamics crm 如何在Microsoft Dynamics CRM 2011中查询商机
dynamics-crmdynamics-crm-2011 
Dynamics crm 搜索简单实体关系的速度非常慢
dynamics-crm 
Dynamics crm 在dynamics crm中，当时间与实体属性相等时，是否可以执行一些逻辑？
dynamics-crm 
Dynamics crm 获得相关活动的帐户
dynamics-crm 
Dynamics crm Dynamics CRM:合同上的货币字段已锁定（禁用），无法解锁
dynamics-crm 
Dynamics crm 导航到“设置”页面
dynamics-crm 
Dynamics crm 使用Power自动导入数据并在CRM中创建记录
dynamics-crm 
Dynamics crm 需要帮助创建汇总子记录的汇总字段'；母公司记录的毛利润值
dynamics-crm 
Dynamics crm Dynamics CRM Power Apps Web门户表单及其子网格未显示在Web浏览器中
dynamics-crm


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 什么'；当谈论变量时，赋值和绑定的区别是什么？
									Python
							 									Variables
							 
Python TypeError：在简单列表上的非序列上迭代
									Python
							 
Python 多重'；或'；打开while循环
									Python
							 									Python 2.7
							 
Python日期转换
									Python
							 
集合的大小是固定的-IronPython
									Python
							 									.net
							 									Python 2.7
							 
Python pygame-在60+处切断的圆圈；fps，由display.flip固定
									Python
							 
Python 如何返回类型为'的故事；bug'；从枢轴球拍
									Python
							 									Python 2.7
							 
将列名称（年份）转换为变量值-Python，R
									Python
							 									R
							 									Pandas
							 
Python加减序列
									Python
							 
Python 创建圆形图像PIL Tkinter
									Python
							 									User Interface
							 									Tkinter
							 
python中数据列表中的根标识：
									Python
							 									Nlp
							 
如何在python中在单个帧/窗口中显示图形和视频文件？
									Python
							 									Python 3.x
							 									Matplotlib
							 									Graph
							 									Wxpython
							 
Python 如何在单词和下一次出现之间提取文本？
									Python
							 									Regex
							 									Python 2.7
							 									Python 3.x
							 
Python、MIME、在电子邮件中嵌入图像
									Python
							 
Python 循环不工作，因为控制台未打印Hello
									Python
							 
Python 我的解密函数有什么问题？
									Python
							 									Python 2.7
							 									Encryption
							 
python将csv列为列表
									Python
							 									Csv
							 
Python（3.6）没有'；Don’别让我闲着
									Python
							 
python十六进制字符串到数组
									Python
							 									Numpy
							 
python不执行在_init__u; py.py中编写的代码
									Python
							 
python中的os.listdir（）不'；t显示目录中的所有文件。它跳过了其中的几个
									Python
							 
Python 如何生成包含NaN的随机值？
									Python
							 									Python 3.x
							 									Pandas
							 									Python 2.7
							 									Numpy
							 
Python pip在没有康达的情况下安装PyTorch时出现不受支持的车轮错误
									Python
							 									Pip
							 									Pytorch
							 
如何多次运行python脚本？
									Python
							 									Selenium
							 									Pycharm
							 
Python 在sklearn中创建自定义转换器时出错-接受2个位置参数，但给出了3个
									Python
							 									Machine Learning
							 									Scikit Learn
							 
Python Django芹菜
									Python
							 									Django
							 
Python Ansible Cisco交换机“；操作需要权限提升“*NetworkChuck示例*
									Python
							 									Ansible
							 
Python 多元线性回归100%准确度
									Python
							 									Machine Learning
							 
Python numpy ndarray对象没有属性附加
									Python
							 									Numpy
							 									Loops
							 
Python 使用相邻值平均值更新2darray中给定值的所有元素
									Python
							 									Pandas
							 									Numpy
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Electron
Glsl
Rdf
Generics
Amazon Ec2
Windows Phone 8
Eclipse Plugin
Atom Editor
Azure Service Fabric
Session
Deployment
Google Compute Engine
Uiview
Visual Studio 2008
Opencv
Leaflet
D3.js
Reporting Services
Autodesk Forge
Linkedin
Objective C
Wolfram Mathematica
Fullcalendar
Wcf
Google Plus
Stata
Browser
Xpages
Angular6
Transactions
Cron
Editor
Mod Rewrite
Unix
Optimization
Perl
Seo
Doxygen
Latex
Ffmpeg
Reference
Post
Django Models
Axapta
Spotify
Discord
Tomcat
Datatables
Logstash
Openid
Breeze
Javafx 2
Discord.py
Exception
Entity Framework 4
Spring Mvc
Video Streaming
Redis
Serialization
Nativescript
Struct
Extjs
Methods
Flutter
Extjs4
Botframework
Uitableview
Openshift
Canvas
Spring Batch
Bash
Asp.net Mvc
Ruby On Rails 3.1
Java 8
Playframework
Actionscript 3
Magento
List
Ubuntu
Asp.net Mvc 4
Cloud
Opengl Es
Firefox
Ruby On Rails 4
C
Shiny
Xslt
Java
Cluster Computing
Prometheus
Parsing
Google Cloud Dataflow
Firebase
Mapreduce
Testng
Visual Studio 2017
Sugarcrm
Visual C++
Angularjs
Mdx
Antlr
Uwp
C# 4.0
Air
Hyperlink
Gitlab
Knockout.js
Jquery
Virtualbox
Activerecord
For Loop
Cocos2d Iphone
Google Cloud Firestore
Vaadin
Kotlin
Octave
Rally
Ravendb
X86
Quickbooks
Oracle11g
Xsd
Asp.net Core
Opengl
Symfony
Rss
Tags
Sml
Symfony1
Vue.js
Makefile
Version Control
Discord.js
Scala
Mercurial
Sapui5
Scheme
Codeigniter
Oop
Character Encoding
Content Management System
Continuous Integration
Svn
Robotframework
Jar
Apache Spark
Drupal
Logging
Datetime
Xna
Z3
Servlets
Postman
Swing
Neo4j
Asp Classic
Automated Tests
Apache Zookeeper
Outlook
Puppet
Regex
Azure Ad B2c
Blackberry
Colors
Serial Port
Smtp
Lotus Notes
Nsis
Twitter
Clojure
Sencha Touch 2
Oracle
Yii2
Ms Access
Import
Junit
Typo3
Safari
Twitter Bootstrap
Modelica
Image
Moodle
Install4j
Amazon Redshift
Udp
Graphql
Passwords
Machine Learning
Ionic Framework
Google Bigquery
Matplotlib
Fiware
Xamarin.ios
Umbraco
Entity Framework Core
Aurelia
Com
Kubernetes
Cryptography
Orientdb
Apache Storm


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网