将数据帧从长格式转换为宽格式(R中有许多列)

将数据帧从长格式转换为宽格式(R中有许多列),r,data.table,transformation,reshape2,dcast,R,Data.table,Transformation,Reshape2,Dcast,这可能已经得到了回答,但我找不到确切的答案 我有一个数据框,如: Area <- c(1,1,1,1,2,2,2,2,3,3,3,3) Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d) Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,) Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6) Y2021 <-

这可能已经得到了回答,但我找不到确切的答案

我有一个数据框,如:

Area <- c(1,1,1,1,2,2,2,2,3,3,3,3)
Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d)
Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,)
Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6)
Y2021 <- c(0.2,0.4,0.5,0.6,0.8,1.0,1.0,1.1,1.2,1.5,1.3,1.5)
y2022 <- c(0.3,0.6,0.2,0.7,0.5,0.6,0.7,0.8,0.9,1.1,1.3,1.6)

dt <- data.frame(Area,Scenario, Y2020, Y2021, Y2022)
我希望通过如下方式旋转场景栏,以获得广泛的格式:

Area Type Y2020_a  Y2021_a  Y2022_a  Y2020_b  Y2021_b ...
 1    EV    0.5      0.2      0.3      0.6      0.4
 2    EV    0.9      0.8      0.5      1.0      1.0
 3    EV    1.3      1.2      0.9      1.4      1.5
我尝试使用@Arun from建议的dcast(dt,id~Scenario,value.var=names(dt)[4:6]),但它返回“Error in.subset2(x,I,exact=exact):递归索引在级别2失败”

这是我实际数据的浓缩版本,因此,如果可以使用更大的数据集进行复制,那就太好了


我希望有人能帮忙!谢谢

您需要先将数据转换为长格式,然后再转换为宽格式

库(tidyverse)
面积类型Y2020_a Y2021_a Y2022_a Y2022_b Y2021_b Y2022_b Y2020_c Y2021_c
#>                            
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>2 EV 0.90.80.5 1 0.6 1.1 1
#>3电动汽车1.31.20.91.41.51.111.51.51.51.51.3
#>#…还有4个变量:Y2022_c、Y2020_d、Y2021_d、,
#>#Y2022_d

由(v0.3.0)于2021年2月1日创建,该命题具有函数
重塑()

dt区域类型Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>5.2电动汽车0.9 0.8 0.5 1.0 1.0 0 0.6 1.1 1.0
#>9.3 EV 1.3 1.2 0.9 1.4 1.5 1.1 1.5 1.3
#>Y2022.c Y2020.d Y2021.d Y2022.d
#> 1     0.8     0.8     0.6     0.7
#> 5     0.7     1.2     1.1     0.8
#> 9     1.3     1.6     1.5     1.6
#由reprex软件包(v0.3.0.9001)于2021-02-01创建

关于,

请尝试查看
tidyr::pivot\u wide()
,此处的文档:。tidyverse的功能往往得到更好的维护。@seagullnutkin你能为这一说法提供一些证据吗?根据我的经验,tidyverse函数往往会非常频繁地更改其整个API。@Davidernburg他们最近对tidyverse中的函数进行了一系列更新,但它是由RStudio维护的,因此我认为tidyverse软件包确实会得到更多人的关注/维护,他们会投入更多的精力来保持它的正常工作<代码>重塑2也是一个很好的软件包,但我喜欢使用tidyverse,因为它的软件包生态系统和良好的文档。这是个人喜好。@seagullnutkin rehsape2甚至不再保留。OP指的是维护良好的data.table包。无论如何,可以使用
库(data.table);dcast(melt(setDT(dt),id=c(“区域”、“类型”、“场景”)),区域+类型~变量+场景)
太棒了!如何保留“类型”列?我把它放在那里只是为了保存它!它没有包含在原始代码中创建的数据框中,因此它不在那里,现在我已经编辑了代码
Area Type Y2020_a  Y2021_a  Y2022_a  Y2020_b  Y2021_b ...
 1    EV    0.5      0.2      0.3      0.6      0.4
 2    EV    0.9      0.8      0.5      1.0      1.0
 3    EV    1.3      1.2      0.9      1.4      1.5
dt <- read.table(header = TRUE, text = "
Area  Scenario Type Y2020  Y2021  Y2022
 1       a      EV   0.5    0.2    0.3
 1       b      EV   0.6    0.4    0.6
 1       c      EV   0.7    0.5    0.8
 1       d      EV   0.8    0.6    0.7
 2       a      EV   0.9    0.8    0.5
 2       b      EV   1.0    1.0    0.6
 2       c      EV   1.1    1.0    0.7
 2       d      EV   1.2    1.1    0.8
 3       a      EV   1.3    1.2    0.9
 3       b      EV   1.4    1.5    1.1
 3       c      EV   1.5    1.3    1.3
 3       d      EV   1.6    1.5    1.6
")

reshape(data = dt,
        idvar = c("Area", "Type"),
        v.names = c("Y2020", "Y2021", "Y2022"),
        timevar = "Scenario",
        direction = "wide")
#>   Area Type Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#> 1    1   EV     0.5     0.2     0.3     0.6     0.4     0.6     0.7     0.5
#> 5    2   EV     0.9     0.8     0.5     1.0     1.0     0.6     1.1     1.0
#> 9    3   EV     1.3     1.2     0.9     1.4     1.5     1.1     1.5     1.3
#>   Y2022.c Y2020.d Y2021.d Y2022.d
#> 1     0.8     0.8     0.6     0.7
#> 5     0.7     1.2     1.1     0.8
#> 9     1.3     1.6     1.5     1.6

# Created on 2021-02-01 by the reprex package (v0.3.0.9001)