将数据帧从长格式转换为宽格式（R中有许多列）_R_Data.table_Transformation_Reshape2_Dcast

将数据帧从长格式转换为宽格式（R中有许多列）

将数据帧从长格式转换为宽格式（R中有许多列）,r,data.table,transformation,reshape2,dcast,R,Data.table,Transformation,Reshape2,Dcast,这可能已经得到了回答，但我找不到确切的答案我有一个数据框，如： Area <- c(1,1,1,1,2,2,2,2,3,3,3,3) Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d) Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,) Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6) Y2021 <-

这可能已经得到了回答，但我找不到确切的答案

我有一个数据框，如：

Area <- c(1,1,1,1,2,2,2,2,3,3,3,3)
Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d)
Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,)
Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6)
Y2021 <- c(0.2,0.4,0.5,0.6,0.8,1.0,1.0,1.1,1.2,1.5,1.3,1.5)
y2022 <- c(0.3,0.6,0.2,0.7,0.5,0.6,0.7,0.8,0.9,1.1,1.3,1.6)

dt <- data.frame(Area,Scenario, Y2020, Y2021, Y2022)

我希望通过如下方式旋转场景栏，以获得广泛的格式：

Area Type Y2020_a  Y2021_a  Y2022_a  Y2020_b  Y2021_b ...
 1    EV    0.5      0.2      0.3      0.6      0.4
 2    EV    0.9      0.8      0.5      1.0      1.0
 3    EV    1.3      1.2      0.9      1.4      1.5

我尝试使用@Arun from建议的dcast（dt，id~Scenario，value.var=names（dt）[4:6]），但它返回“Error in.subset2（x，I，exact=exact）：递归索引在级别2失败”

这是我实际数据的浓缩版本，因此，如果可以使用更大的数据集进行复制，那就太好了

我希望有人能帮忙！谢谢

您需要先将数据转换为长格式，然后再转换为宽格式

库（tidyverse）
面积类型Y2020_a Y2021_a Y2022_a Y2022_b Y2021_b Y2022_b Y2020_c Y2021_c
#>                            
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>2 EV 0.90.80.5 1 0.6 1.1 1
#>3电动汽车1.31.20.91.41.51.111.51.51.51.51.3
#>#…还有4个变量：Y2022_c、Y2020_d、Y2021_d、，
#>#Y2022_d

由（v0.3.0）于2021年2月1日创建，该命题具有函数

重塑（）

：

dt区域类型Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>5.2电动汽车0.9 0.8 0.5 1.0 1.0 0 0.6 1.1 1.0
#>9.3 EV 1.3 1.2 0.9 1.4 1.5 1.1 1.5 1.3
#>Y2022.c Y2020.d Y2021.d Y2022.d
#> 1     0.8     0.8     0.6     0.7
#> 5     0.7     1.2     1.1     0.8
#> 9     1.3     1.6     1.5     1.6
#由reprex软件包（v0.3.0.9001）于2021-02-01创建

关于，

请尝试查看

tidyr:：pivot\u wide（）

，此处的文档：。tidyverse的功能往往得到更好的维护。@seagullnutkin你能为这一说法提供一些证据吗？根据我的经验，tidyverse函数往往会非常频繁地更改其整个API。@Davidernburg他们最近对tidyverse中的函数进行了一系列更新，但它是由RStudio维护的，因此我认为tidyverse软件包确实会得到更多人的关注/维护，他们会投入更多的精力来保持它的正常工作<代码>重塑2也是一个很好的软件包，但我喜欢使用tidyverse，因为它的软件包生态系统和良好的文档。这是个人喜好。@seagullnutkin rehsape2甚至不再保留。OP指的是维护良好的data.table包。无论如何，可以使用

库（data.table）；dcast（melt（setDT（dt），id=c（“区域”、“类型”、“场景”）），区域+类型~变量+场景）

太棒了！如何保留“类型”列？我把它放在那里只是为了保存它！它没有包含在原始代码中创建的数据框中，因此它不在那里，现在我已经编辑了代码

Area Type Y2020_a  Y2021_a  Y2022_a  Y2020_b  Y2021_b ...
 1    EV    0.5      0.2      0.3      0.6      0.4
 2    EV    0.9      0.8      0.5      1.0      1.0
 3    EV    1.3      1.2      0.9      1.4      1.5

dt <- read.table(header = TRUE, text = "
Area  Scenario Type Y2020  Y2021  Y2022
 1       a      EV   0.5    0.2    0.3
 1       b      EV   0.6    0.4    0.6
 1       c      EV   0.7    0.5    0.8
 1       d      EV   0.8    0.6    0.7
 2       a      EV   0.9    0.8    0.5
 2       b      EV   1.0    1.0    0.6
 2       c      EV   1.1    1.0    0.7
 2       d      EV   1.2    1.1    0.8
 3       a      EV   1.3    1.2    0.9
 3       b      EV   1.4    1.5    1.1
 3       c      EV   1.5    1.3    1.3
 3       d      EV   1.6    1.5    1.6
")

reshape(data = dt,
        idvar = c("Area", "Type"),
        v.names = c("Y2020", "Y2021", "Y2022"),
        timevar = "Scenario",
        direction = "wide")
#>   Area Type Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#> 1    1   EV     0.5     0.2     0.3     0.6     0.4     0.6     0.7     0.5
#> 5    2   EV     0.9     0.8     0.5     1.0     1.0     0.6     1.1     1.0
#> 9    3   EV     1.3     1.2     0.9     1.4     1.5     1.1     1.5     1.3
#>   Y2022.c Y2020.d Y2021.d Y2022.d
#> 1     0.8     0.8     0.6     0.7
#> 5     0.7     1.2     1.1     0.8
#> 9     1.3     1.6     1.5     1.6

# Created on 2021-02-01 by the reprex package (v0.3.0.9001)