将数据帧从长格式转换为宽格式(R中有许多列)
这可能已经得到了回答,但我找不到确切的答案 我有一个数据框,如:将数据帧从长格式转换为宽格式(R中有许多列),r,data.table,transformation,reshape2,dcast,R,Data.table,Transformation,Reshape2,Dcast,这可能已经得到了回答,但我找不到确切的答案 我有一个数据框,如: Area <- c(1,1,1,1,2,2,2,2,3,3,3,3) Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d) Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,) Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6) Y2021 <-
Area <- c(1,1,1,1,2,2,2,2,3,3,3,3)
Scenario <- c(a,b,c,d,a,b,c,d,a,b,c,d)
Type <- c(EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV, EV,)
Y2020 <- c(0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6)
Y2021 <- c(0.2,0.4,0.5,0.6,0.8,1.0,1.0,1.1,1.2,1.5,1.3,1.5)
y2022 <- c(0.3,0.6,0.2,0.7,0.5,0.6,0.7,0.8,0.9,1.1,1.3,1.6)
dt <- data.frame(Area,Scenario, Y2020, Y2021, Y2022)
我希望通过如下方式旋转场景栏,以获得广泛的格式:
Area Type Y2020_a Y2021_a Y2022_a Y2020_b Y2021_b ...
1 EV 0.5 0.2 0.3 0.6 0.4
2 EV 0.9 0.8 0.5 1.0 1.0
3 EV 1.3 1.2 0.9 1.4 1.5
我尝试使用@Arun from建议的dcast(dt,id~Scenario,value.var=names(dt)[4:6]),但它返回“Error in.subset2(x,I,exact=exact):递归索引在级别2失败”
这是我实际数据的浓缩版本,因此,如果可以使用更大的数据集进行复制,那就太好了
我希望有人能帮忙!谢谢您需要先将数据转换为长格式,然后再转换为宽格式
库(tidyverse)
面积类型Y2020_a Y2021_a Y2022_a Y2022_b Y2021_b Y2022_b Y2020_c Y2021_c
#>
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>2 EV 0.90.80.5 1 0.6 1.1 1
#>3电动汽车1.31.20.91.41.51.111.51.51.51.51.3
#>#…还有4个变量:Y2022_c、Y2020_d、Y2021_d、,
#>#Y2022_d
由(v0.3.0)于2021年2月1日创建,该命题具有函数
重塑()
:
dt区域类型Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#>1电动汽车0.50.2 0.30.6 0.4 0.6 0.7 0.5
#>5.2电动汽车0.9 0.8 0.5 1.0 1.0 0 0.6 1.1 1.0
#>9.3 EV 1.3 1.2 0.9 1.4 1.5 1.1 1.5 1.3
#>Y2022.c Y2020.d Y2021.d Y2022.d
#> 1 0.8 0.8 0.6 0.7
#> 5 0.7 1.2 1.1 0.8
#> 9 1.3 1.6 1.5 1.6
#由reprex软件包(v0.3.0.9001)于2021-02-01创建
关于,请尝试查看
tidyr::pivot\u wide()
,此处的文档:。tidyverse的功能往往得到更好的维护。@seagullnutkin你能为这一说法提供一些证据吗?根据我的经验,tidyverse函数往往会非常频繁地更改其整个API。@Davidernburg他们最近对tidyverse中的函数进行了一系列更新,但它是由RStudio维护的,因此我认为tidyverse软件包确实会得到更多人的关注/维护,他们会投入更多的精力来保持它的正常工作<代码>重塑2也是一个很好的软件包,但我喜欢使用tidyverse,因为它的软件包生态系统和良好的文档。这是个人喜好。@seagullnutkin rehsape2甚至不再保留。OP指的是维护良好的data.table包。无论如何,可以使用库(data.table);dcast(melt(setDT(dt),id=c(“区域”、“类型”、“场景”)),区域+类型~变量+场景)
太棒了!如何保留“类型”列?我把它放在那里只是为了保存它!它没有包含在原始代码中创建的数据框中,因此它不在那里,现在我已经编辑了代码
Area Type Y2020_a Y2021_a Y2022_a Y2020_b Y2021_b ...
1 EV 0.5 0.2 0.3 0.6 0.4
2 EV 0.9 0.8 0.5 1.0 1.0
3 EV 1.3 1.2 0.9 1.4 1.5
dt <- read.table(header = TRUE, text = "
Area Scenario Type Y2020 Y2021 Y2022
1 a EV 0.5 0.2 0.3
1 b EV 0.6 0.4 0.6
1 c EV 0.7 0.5 0.8
1 d EV 0.8 0.6 0.7
2 a EV 0.9 0.8 0.5
2 b EV 1.0 1.0 0.6
2 c EV 1.1 1.0 0.7
2 d EV 1.2 1.1 0.8
3 a EV 1.3 1.2 0.9
3 b EV 1.4 1.5 1.1
3 c EV 1.5 1.3 1.3
3 d EV 1.6 1.5 1.6
")
reshape(data = dt,
idvar = c("Area", "Type"),
v.names = c("Y2020", "Y2021", "Y2022"),
timevar = "Scenario",
direction = "wide")
#> Area Type Y2020.a Y2021.a Y2022.a Y2020.b Y2021.b Y2022.b Y2020.c Y2021.c
#> 1 1 EV 0.5 0.2 0.3 0.6 0.4 0.6 0.7 0.5
#> 5 2 EV 0.9 0.8 0.5 1.0 1.0 0.6 1.1 1.0
#> 9 3 EV 1.3 1.2 0.9 1.4 1.5 1.1 1.5 1.3
#> Y2022.c Y2020.d Y2021.d Y2022.d
#> 1 0.8 0.8 0.6 0.7
#> 5 0.7 1.2 1.1 0.8
#> 9 1.3 1.6 1.5 1.6
# Created on 2021-02-01 by the reprex package (v0.3.0.9001)