用rvest刮网_R_Web Scraping_Rvest - Fatal编程技术网

用rvest刮网

r web-scraping

用rvest刮网,r,web-scraping,rvest,R,Web Scraping,Rvest,我试图从r包rvest中使用read_html获取一个数据表我尝试了以下代码： library(rvest) raw <- read_html("https://demanda.ree.es/movil/peninsula/demanda/tablas/2016-01-02/2") 对下一步该怎么做有什么建议吗谢谢该网站正在使用angular打电话获取数据。您可以使用该调用获取原始JSON。响应不是纯JSON，因此您不能只从JSON（url）运行，您必须下载数据并在解析之前除去

我试图从r包rvest中使用read_html获取一个数据表

我尝试了以下代码：

library(rvest)
  raw <- read_html("https://demanda.ree.es/movil/peninsula/demanda/tablas/2016-01-02/2")

对下一步该怎么做有什么建议吗

谢谢

该网站正在使用angular打电话获取数据。您可以使用该调用获取原始JSON。响应不是纯JSON，因此您不能只从JSON（url）运行

，您必须下载数据并在解析之前除去非JSON内容
library(jsonlite)
library(httr)
url <- "https://demanda.ree.es/WSvisionaMovilesPeninsulaRest/resources/demandaGeneracionPeninsula?callback=angular.callbacks._2&curva=DEMANDA&fecha=2016-01-02"
a <- GET(url)
a <- content(a, as="text")
# get rid of the non-JSON stuff...
a <- gsub("^angular.callbacks._2\\(", "", a)
a <- gsub("\\);$", "", a)
df <- fromJSON(a, simplifyDataFrame = TRUE)

library（jsonlite）
图书馆（httr）
太棒了，谢谢！你能解释一下你在哪里找到那个电话吗？在Chrome中使用“inspect”可以找到它吗？非常酷，谢谢你的解释。这对我来说很有用。@cory看起来是一个有趣的解决方案……你认为你能帮我做这个（）吗？
html_nodes(raw,xpath = '//*[(@id = "tabla_generacion")]//*[contains(concat( " ", @class, " " ), concat( " ", "ng-scope", " " ))]')

library(jsonlite)
library(httr)
url <- "https://demanda.ree.es/WSvisionaMovilesPeninsulaRest/resources/demandaGeneracionPeninsula?callback=angular.callbacks._2&curva=DEMANDA&fecha=2016-01-02"
a <- GET(url)
a <- content(a, as="text")
# get rid of the non-JSON stuff...
a <- gsub("^angular.callbacks._2\\(", "", a)
a <- gsub("\\);$", "", a)
df <- fromJSON(a, simplifyDataFrame = TRUE)




[web scraping]相关文章推荐



                                                        
Web scraping 从网站上删除链接-can'；我看不到href
web-scraping 
Web scraping 如何清理.aspx站点
web-scraping 
Web scraping 我可以让htmlunit刮板在多页上工作吗？
web-scraping 
Web scraping 如何使用Scrapy从网站上刮取地址？
web-scrapingscrapy 
Web scraping Import.io-它能取代和服实验室吗
web-scraping 
Web scraping 特定站点的刮擦和飞溅超时
web-scrapingscrapy 
Web scraping Python网页抓取希腊字母未显示
web-scraping 
Web scraping python3.7-PhantomJS-Driver.get（url）和'；窗口句柄/名称无效或已关闭？'；
web-scrapingphantomjs 
Web scraping 使用Beautifulsoup刮取欧足联网页
web-scraping 
Web scraping 我需要从100个Microsoft Word文档中提取数据，并在CSV文件中创建一个表
web-scraping 
Web scraping 使用Scrapy刮取数据时数据重复
web-scrapingscrapy 
Web scraping 木偶演员的执行环境被破坏，很可能是因为导航。当刮取大量内容时
web-scraping 
Web scraping 如果加载聊天机器人的代码隐藏在Google Tag Manager中，是否有一种方法可以通过编程方式扫描网页以查找聊天机器人的存在？
web-scraping 
Web scraping 谷歌如何在搜索时解决所有问题？
web-scraping 
                                       





随机文章推荐



                                                        
为什么OFS和FS在awk中不同？
awk 
Awk 将新列添加到文件中
awk 
awk n-gram提取不正确
awk 
了解AWK命令中使用的SUB
awk 
使用awk替换第一次出现的文本
awk 
awk命令中的子字符串
awk 
Awk 将字符串grep到另一个文件
awkgrep 
Awk SED：用另一个字符串替换字符串
awksed 
Awk 如何使用三个空格作为分隔符？
awk 
AWK 3.1.7-一个系统中的多个回路
awk 
AWK-将多个头文件拆分为单独的文件？
awk 
为什么gawk printf给出错误的舍入结果？
awk 
awk打印存储在数组中的列和上一列
awk 
Awk 比较不匹配的列和打印值。
awk 
Awk 如何使用sed替换多行中的单词？
awksed 
特定字段中的awk搜索模式并替换其内容
awk 
Awk 使用小数秒创建时间戳
awk 
Awk 合并特定列中的前两行
awk 
Awk 如何将一个文件的内容重定向到其他文件？
awk 
使用awk删除重复的结果
awk


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
基于R中的另一列删除重复日期
									R
							 									Date
							 
如何绘制R表的箱线图？
									R
							 
e1071包中的朴素贝叶斯分类器[R]-编辑数据
									R
							 
R 为什么Jenks算法这么慢？
									R
							 									Algorithm
							 
R 需要一个更有效的阈值匹配函数
									R
							 									Function
							 
无法通过Perl包统计信息调用任何库：：R
									R
							 									Perl
							 									Cygwin
							 
R数据表：选择组内时钟的最小值
									R
							 
在R包中调用lmFit（limma）时出错
									R
							 
Ada在R给我一个分类
									R
							 
twitteR r包：如何在API限制内获得每个帐户尽可能多的推文
									R
							 									Twitter
							 
R 嵌套数据结构
									R
							 
在RStudio中自动插入注释
									R
							 
R mle2函数：L-BFGS-B需要有限的“fn”值
									R
							 
统计数据帧中分类变量的出现次数（R）
									R
							 
R尝试使用for（）填充矩阵
									R
							 									Loops
							 									For Loop
							 
R 在colMeans计算中处理额外的行
									R
							 
R中的循环不起作用
									R
							 									Loops
							 
R 带日期的从X站到Y站的行程表。计算每个站点每天的出站和入站出行次数，并将其存储为数据帧
									R
							 
如何将特定日期的NA数据替换为R中数据帧相同日期的不同年份的平均数据？
									R
							 									Replace
							 
R 删除行而不过滤其他值
									R
							 
R 无法调用函数。是否有控制此操作的设置？
									R
							 
重新排列dplyr中数据帧的行
									R
							 
如何向dataframe中添加一个布尔列，该列指示每个假日日期是否属于dates列
									R
							 
R：如何创建删除按钮
									R
							 									Shiny
							 
R 使用if-else循环时出现错误“条件的长度大于1，且仅使用第一个元素”
									R
							 
R 你能把数据导入成对t检验吗？
									R
							 
R 嵌套循环不会产生所需的结果
									R
							 									Loops
							 									For Loop
							 
单击复选框Input-R后，将selectInput选项灰显
									R
							 									Shiny
							 
从R中的当前时间中减去时间
									R
							 
R 在图例中使用下标
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Racket
Soap
Jqgrid
Jaxb
Winforms
Chart.js
Cloud
Spotify
Clearcase
Cygwin
Sql Server
Zsh
Sap
Ignite
Openshift
Sed
Raspberry Pi
Mips
Jsf
Openlayers
Actionscript
Debugging
Telegram
Gnuplot
Grafana
Logstash
Keras
Crystal Reports
Triggers
Sharepoint 2007
Asp.net Mvc
Printing
Automation
Dictionary
Menu
Tfs
Utf 8
Ocaml
Keyboard
Breeze
Apache Camel
Vagrant
Testing
Arrays
Enums
Twig
Text
Scheme
Android Emulator
Rxjs
Html
Delphi
Symfony
Google Analytics
Merge
Machine Learning
Asp.net Core Mvc
Usb
Tcl
C++ Cli
Magento2
Centos
Yii2
Apache Flink
Apache Nifi
Routes
Asp.net Mvc 4
Curl
C++
Google Cloud Platform
Sdk
Safari
Liferay
Hazelcast
Installation
Amazon Redshift
Memory Management
Python
Templates
Single Sign On
Streaming
String
Netty
Jdbc
Cakephp
Coffeescript
Seo
Doctrine Orm
Parameters
Bootstrap 4
Xamarin.android
Email
Acumatica
Webpack
Junit
Azure Data Factory
Material Ui
Makefile
Jquery
Activemq
Pascal
Graphviz
Pandas
Google Drive Api
Migration
C# 3.0
D3.js
Image Processing
Jestjs
Xna
Svg
Jboss
Woocommerce
Dynamics Crm
Asp.net Mvc 2
C# 4.0
Apache Kafka
Database
Azure Functions
Karate
Passwords
Lotus Notes
Sparql
Ruby On Rails
Excel
Drupal 6
Clang
Report
Wolfram Mathematica
Gmail
Webgl
Atom Editor
Reactjs
Graphics
Lucene
Azure Sql Database
Cron
Google Colaboratory
Unicode
Encryption
Xamarin
Joomla
Ravendb
Couchdb
Localization
Wcf
Sprite Kit
Http
Meteor
Sql Server 2008
Codeigniter
Postgresql
Nestjs
System Verilog
Exception
Telerik
Glsl
Playframework
Rdf
Cuda
Swift
Rest
Smtp
R
Youtube Api
Shiny
Kdb
Mfc
Biztalk
Hbase
Jasper Reports
Aurelia
Xamarin.ios
Dataframe
Core Data
Silverlight 4.0
Firefox
Google Plus
Nsis
Arduino
Pdf
Random
Paypal
Couchbase
Applescript
Sonarqube
Gtk
Date
Oracle
Workflow
Exception Handling
Spring Boot
Responsive Design
Puppet
Azure Service Fabric
Ionic Framework
Intellij Idea
Perforce
Ansible
Backbone.js
Sorting


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网