R 创建包含多行的新列
我有一个数据框,如下所示:R 创建包含多行的新列,r,row,reshape,data-manipulation,R,Row,Reshape,Data Manipulation,我有一个数据框,如下所示: dat <- read.table(text= "ID | Year | Month | Variable | Value1 | Value2 | Value3 1 | 1950 | 1 | PRCP | 0 | 1 | 0 1 | 1950 | 1 | TMAX | 52 | 51 | 52 1 | 1950 | 1 | TMIN | 41 |
dat <- read.table(text=
"ID | Year | Month | Variable | Value1 | Value2 | Value3
1 | 1950 | 1 | PRCP | 0 | 1 | 0
1 | 1950 | 1 | TMAX | 52 | 51 | 52
1 | 1950 | 1 | TMIN | 41 | 41 | 39
1 | 1950 | 2 | PRCP | 1 | 0 | 1
1 | 1950 | 2 | TMAX | 55 | 57 | 58",
header=TRUE, sep="|")
到目前为止,我已经能够为每个天气变量创建3个单独的数据集,但我不知道如何创建新列并相应地展开行(每个月的每一天都需要31个新行)。我是R的新手,非常感谢您的帮助-谢谢 我们可以使用
data.table
中的melt/dcast
。我们将“data.frame”转换为“data.table”(setDT(dat)
),使用melt
,将“宽”格式重塑为“长”格式,创建一个按“ID”、“年”、“月”和“变量”分组的序列列(“ind”)。通过粘贴“年”、“月”和“索引”来创建“日期”列,然后使用dcast
将其重塑为“宽”格式。我们不需要创建三个单独的数据集,而是可以将所有信息都放在一个数据集中
library(data.table)#v1.9.6+
dM <- melt(setDT(dat), measure=patterns('^Value'))
dM1 <- dM[, ind:= 1:.N, by = .(ID, Year, Month, Variable)]
dM1[, Date:=as.Date(sprintf('%04d-%02d-%02d', Year, Month, ind))]
dcast(dM1, ID+Date~Variable, value.var='value1')
# ID Date PRCP TMAX TMIN
#1: 1 1950-01-01 0 52 41
#2: 1 1950-01-02 1 51 41
#3: 1 1950-01-03 0 52 39
#4: 1 1950-02-01 1 55 NA
#5: 1 1950-02-02 0 57 NA
#6: 1 1950-02-03 1 58 NA
library(data.table)#v1.9.6+
dM我们可以使用data.table
中的melt/dcast
。我们将“data.frame”转换为“data.table”(setDT(dat)
),使用melt
,将“宽”格式重塑为“长”格式,创建一个按“ID”、“年”、“月”和“变量”分组的序列列(“ind”)。通过粘贴“年”、“月”和“索引”来创建“日期”列,然后使用dcast
将其重塑为“宽”格式。我们不需要创建三个单独的数据集,而是可以将所有信息都放在一个数据集中
library(data.table)#v1.9.6+
dM <- melt(setDT(dat), measure=patterns('^Value'))
dM1 <- dM[, ind:= 1:.N, by = .(ID, Year, Month, Variable)]
dM1[, Date:=as.Date(sprintf('%04d-%02d-%02d', Year, Month, ind))]
dcast(dM1, ID+Date~Variable, value.var='value1')
# ID Date PRCP TMAX TMIN
#1: 1 1950-01-01 0 52 41
#2: 1 1950-01-02 1 51 41
#3: 1 1950-01-03 0 52 39
#4: 1 1950-02-01 1 55 NA
#5: 1 1950-02-02 0 57 NA
#6: 1 1950-02-03 1 58 NA
library(data.table)#v1.9.6+
dM你能让我复制/粘贴数据样本吗?另外,你能提供一些你的代码,这样我就可以复制你得到的吗?第一个问题做得很好!你能让我复制/粘贴数据样本吗?另外,你能提供一些你的代码,这样我就可以复制你得到的吗?第一个问题做得很好!
dat <- structure(list(ID = c(1, 1, 1, 1, 1), Year = c(1950, 1950, 1950,
1950, 1950), Month = c(1, 1, 1, 2, 2), Variable = c("PRCP", "TMAX",
"TMIN", "PRCP", "TMAX"), Value1 = c(0, 52, 41, 1, 55), Value2 = c(1,
51, 41, 0, 57), Value3 = c(0, 52, 39, 1, 58)), .Names = c("ID",
"Year", "Month", "Variable", "Value1", "Value2", "Value3"),
row.names = c(NA, -5L), class = "data.frame")