R 导入excel文件
我试图将一个文件从NORDPOOL.COM下载到R中,但不知怎么的,xls格式正在变成一种奇怪的格式 我尝试过不同的文件格式,但read.table是唯一一个提供有意义的表的文件格式R 导入excel文件,r,excel,import,R,Excel,Import,我试图将一个文件从NORDPOOL.COM下载到R中,但不知怎么的,xls格式正在变成一种奇怪的格式 我尝试过不同的文件格式,但read.table是唯一一个提供有意义的表的文件格式 df <- read.table("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls") dfrvest有助于 library(rvest) pa
df <- read.table("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")
dfrvest
有助于
library(rvest)
page <- read_html("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")
out <- page %>% html_node("table") %>% html_table()
out <- out[-c(1,2,3,4),c(1,2,23,24,25,26)]
colnames(out) <- c("Date","Hour","DK1_Up","DK1_Down","DK2_Up","DK2_Down")
head(out)
Date Hour DK1_Up DK1_Down DK2_Up DK2_Down
5 01-01-2019 00 - 01 211,45 211,45 211,45 211,45
6 01-01-2019 01 - 02 75,19 75,19 75,19 75,19
7 01-01-2019 02 - 03 -30,46 -30,46 -30,46 -30,46
8 01-01-2019 03 - 04 -73,99 -73,99 -73,99 -73,99
9 01-01-2019 04 - 05 -55,33 -55,33 -55,33 -55,33
10 01-01-2019 05 - 06 -93,71 -93,71 -93,71 -93,71
库(rvest)
页面%html\u表()
outrvest
有助于
library(rvest)
page <- read_html("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")
out <- page %>% html_node("table") %>% html_table()
out <- out[-c(1,2,3,4),c(1,2,23,24,25,26)]
colnames(out) <- c("Date","Hour","DK1_Up","DK1_Down","DK2_Up","DK2_Down")
head(out)
Date Hour DK1_Up DK1_Down DK2_Up DK2_Down
5 01-01-2019 00 - 01 211,45 211,45 211,45 211,45
6 01-01-2019 01 - 02 75,19 75,19 75,19 75,19
7 01-01-2019 02 - 03 -30,46 -30,46 -30,46 -30,46
8 01-01-2019 03 - 04 -73,99 -73,99 -73,99 -73,99
9 01-01-2019 04 - 05 -55,33 -55,33 -55,33 -55,33
10 01-01-2019 05 - 06 -93,71 -93,71 -93,71 -93,71
库(rvest)
页面%html\u表()
排除可能的重复,注意数据的文件格式/扩展名。它们不尽相同。我认为你不能直接导入那个文件。标题行上方有需要格式化/删除的材料?使用read.xlsx
从xlsx
导入可能更容易。我可以看到有一个问题,但我是空白tbh。。。我看到一个XLS文件,我可以在excel中打开它。我试着把它导入excel文件,事情变糟了。。。我得到的东西看起来像html。。。但我尝试导入HTML格式,但没有任何结果。。你能给我一个如何导入电子表格的提示吗?更好的是,我会将文件转换为CSV格式,然后只使用read.table
(这样就可以完全避免处理xlsx
)。所有这些是否可行取决于需要处理的文件数量。我认为很多手工工作可以通过awk
脚本或类似的东西实现自动化。可能的重复请注意数据的文件格式/扩展名。它们不尽相同。我认为你不能直接导入那个文件。标题行上方有需要格式化/删除的材料?使用read.xlsx
从xlsx
导入可能更容易。我可以看到有一个问题,但我是空白tbh。。。我看到一个XLS文件,我可以在excel中打开它。我试着把它导入excel文件,事情变糟了。。。我得到的东西看起来像html。。。但我尝试导入HTML格式,但没有任何结果。。你能给我一个如何导入电子表格的提示吗?更好的是,我会将文件转换为CSV格式,然后只使用read.table
(这样就可以完全避免处理xlsx
)。所有这些是否可行取决于需要处理的文件数量。我认为很多手工工作可以通过awk
脚本或类似的东西实现自动化。