R:按组的唯一矩阵行
我希望通过组变量在矩阵行中找到缺失观测值的唯一组合 我可以使用subset、cbind和rbind命令序列生成矩阵u3,从而使用示例数据集实现这一点 然而,我怀疑有一种更好的方法,不需要“手动”为每个级别的组变量对矩阵进行子集设置。我尝试在底部使用tapply命令,但无法使其工作 衷心感谢您的建议R:按组的唯一矩阵行,r,R,我希望通过组变量在矩阵行中找到缺失观测值的唯一组合 我可以使用subset、cbind和rbind命令序列生成矩阵u3,从而使用示例数据集实现这一点 然而,我怀疑有一种更好的方法,不需要“手动”为每个级别的组变量对矩阵进行子集设置。我尝试在底部使用tapply命令,但无法使其工作 衷心感谢您的建议 my.data <- matrix(c( 1, 0, 1, 1, 1, NA, 1, 1, 0, 1, NA, 0,
my.data <- matrix(c(
1, 0, 1, 1, 1,
NA, 1, 1, 0, 1,
NA, 0, 0, 0, 1,
NA, 1,NA, 1, 1,
NA, 1, 1, 1, 1,
0, 0, 1, 0, 1,
NA, 0, 0, 0, 1,
0,NA,NA,NA, 1,
1,NA,NA,NA, 1,
1, 1, 1, 1, 1,
NA, 1, 1, 0, 1,
1, 0, 1, 1, 2,
1, 1, NA, 0, 2,
NA, NA, NA, 0, 2,
NA, NA,NA, 1, 2,
1, 1, 1, NA, 2,
0, 0, 1, 0, 2,
NA, 0, 0, 0, 2,
0,NA,NA,NA, 2,
1,NA,NA,NA, 2,
1, 1, 1, 1, 2,
0, 1, 1, NA, 2
),
nrow=22, byrow=T,
dimnames = list(NULL, c("c1","c2","c3","c4","my.group")))
my.data <- as.data.frame(my.data)
my.data
g1 <- subset(my.data, my.data$my.group==1)
u1 <- unique( is.na(g1[1:4]) )
u1 <- cbind(1,u1)
g2 <- subset(my.data, my.data$my.group==2)
u2 <- unique( is.na(g2[1:4]) )
u2 <- cbind(2,u2)
u3 <- rbind(u1,u2)
u3
tapply(my.data[,1:4], my.data$my.group, function(x) {unique(is.na(x), 'rows') } )
您可以使用
plyr
软件包实现这一点,它非常适合“将此功能应用于每个组”类型的应用程序。特别是,函数ddply
:
library(plyr)
u3 <- ddply(my.data,.(my.group),
function(df)
data.frame(unique(is.na(df[1:4])))
)
您可以使用.matrix(u3)获得数值矩阵
library(plyr)
u3 <- ddply(my.data,.(my.group),
function(df)
data.frame(unique(is.na(df[1:4])))
)
my.group c1 c2 c3 c4
1 1 FALSE FALSE FALSE FALSE
2 1 TRUE FALSE FALSE FALSE
3 1 TRUE FALSE TRUE FALSE
4 1 FALSE TRUE TRUE TRUE
5 2 FALSE FALSE FALSE FALSE
6 2 FALSE FALSE TRUE FALSE
7 2 TRUE TRUE TRUE FALSE
8 2 FALSE FALSE FALSE TRUE
9 2 TRUE FALSE FALSE FALSE
10 2 FALSE TRUE TRUE TRUE