Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/excel/25.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 导入excel文件_R_Excel_Import - Fatal编程技术网

R 导入excel文件

R 导入excel文件,r,excel,import,R,Excel,Import,我试图将一个文件从NORDPOOL.COM下载到R中,但不知怎么的,xls格式正在变成一种奇怪的格式 我尝试过不同的文件格式,但read.table是唯一一个提供有意义的表的文件格式 df <- read.table("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls") dfrvest有助于 library(rvest) pa

我试图将一个文件从NORDPOOL.COM下载到R中,但不知怎么的,xls格式正在变成一种奇怪的格式

我尝试过不同的文件格式,但read.table是唯一一个提供有意义的表的文件格式

 df <- read.table("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")

df
rvest
有助于

library(rvest)

page <- read_html("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")

out <- page %>%  html_node("table")   %>%    html_table()
out <- out[-c(1,2,3,4),c(1,2,23,24,25,26)]
colnames(out) <- c("Date","Hour","DK1_Up","DK1_Down","DK2_Up","DK2_Down")

head(out)

         Date    Hour DK1_Up DK1_Down DK2_Up DK2_Down
5  01-01-2019 00 - 01 211,45   211,45 211,45   211,45
6  01-01-2019 01 - 02  75,19    75,19  75,19    75,19
7  01-01-2019 02 - 03 -30,46   -30,46 -30,46   -30,46
8  01-01-2019 03 - 04 -73,99   -73,99 -73,99   -73,99
9  01-01-2019 04 - 05 -55,33   -55,33 -55,33   -55,33
10 01-01-2019 05 - 06 -93,71   -93,71 -93,71   -93,71
库(rvest)
页面%html\u表()

out
rvest
有助于

library(rvest)

page <- read_html("https://www.nordpoolgroup.com/globalassets/marketdata-excel-files/regulating-prices_2019_hourly_dkk.xls")

out <- page %>%  html_node("table")   %>%    html_table()
out <- out[-c(1,2,3,4),c(1,2,23,24,25,26)]
colnames(out) <- c("Date","Hour","DK1_Up","DK1_Down","DK2_Up","DK2_Down")

head(out)

         Date    Hour DK1_Up DK1_Down DK2_Up DK2_Down
5  01-01-2019 00 - 01 211,45   211,45 211,45   211,45
6  01-01-2019 01 - 02  75,19    75,19  75,19    75,19
7  01-01-2019 02 - 03 -30,46   -30,46 -30,46   -30,46
8  01-01-2019 03 - 04 -73,99   -73,99 -73,99   -73,99
9  01-01-2019 04 - 05 -55,33   -55,33 -55,33   -55,33
10 01-01-2019 05 - 06 -93,71   -93,71 -93,71   -93,71
库(rvest)
页面%html\u表()

排除可能的重复,注意数据的文件格式/扩展名。它们不尽相同。我认为你不能直接导入那个文件。标题行上方有需要格式化/删除的材料?使用
read.xlsx
xlsx
导入可能更容易。我可以看到有一个问题,但我是空白tbh。。。我看到一个XLS文件,我可以在excel中打开它。我试着把它导入excel文件,事情变糟了。。。我得到的东西看起来像html。。。但我尝试导入HTML格式,但没有任何结果。。你能给我一个如何导入电子表格的提示吗?更好的是,我会将文件转换为CSV格式,然后只使用
read.table
(这样就可以完全避免处理
xlsx
)。所有这些是否可行取决于需要处理的文件数量。我认为很多手工工作可以通过
awk
脚本或类似的东西实现自动化。可能的重复请注意数据的文件格式/扩展名。它们不尽相同。我认为你不能直接导入那个文件。标题行上方有需要格式化/删除的材料?使用
read.xlsx
xlsx
导入可能更容易。我可以看到有一个问题,但我是空白tbh。。。我看到一个XLS文件,我可以在excel中打开它。我试着把它导入excel文件,事情变糟了。。。我得到的东西看起来像html。。。但我尝试导入HTML格式,但没有任何结果。。你能给我一个如何导入电子表格的提示吗?更好的是,我会将文件转换为CSV格式,然后只使用
read.table
(这样就可以完全避免处理
xlsx
)。所有这些是否可行取决于需要处理的文件数量。我认为很多手工工作可以通过
awk
脚本或类似的东西实现自动化。