R 从向量构造二元矩阵的更简洁方法
我有一个有趣的挑战:我试图从整数向量构造一个二进制矩阵。二进制矩阵应包含与向量长度一样多的行,以及与整数向量中的最大值一样多的列。矩阵中的第i行将对应于向量的第i个元素,该行在位置j处包含1,其中j等于向量的第i个元素的值;否则,该行包含零。如果第i个整数的值为0,则整个第i行应为0 为了简化这一过程,这里有一个可重复使用的示例:R 从向量构造二元矩阵的更简洁方法,r,matrix,vector,R,Matrix,Vector,我有一个有趣的挑战:我试图从整数向量构造一个二进制矩阵。二进制矩阵应包含与向量长度一样多的行,以及与整数向量中的最大值一样多的列。矩阵中的第i行将对应于向量的第i个元素,该行在位置j处包含1,其中j等于向量的第i个元素的值;否则,该行包含零。如果第i个整数的值为0,则整个第i行应为0 为了简化这一过程,这里有一个可重复使用的示例: set.seed(1) playv<-sample(0:5,20,replace=TRUE)#sample integer vector playmat<
set.seed(1)
playv<-sample(0:5,20,replace=TRUE)#sample integer vector
playmat<-matrix(playv,nrow=length(playv),ncol=max(playv))#create matrix from vector
for (i in 1:length(playv)){
pos<-as.integer(playmat[i,1])
playmat[i,pos]<-1
playmat[i,-pos]<-0}
head(playmat)
[,1] [,2] [,3] [,4] [,5]
[1,] 1 0 0 0 0
[2,] 0 1 0 0 0
[3,] 0 0 1 0 0
[4,] 0 0 0 0 1
[5,] 1 0 0 0 0
[6,] 0 0 0 0 1
set.seed(1)
普拉夫
model.matrix
比table
Unit: seconds
expr min lq median uq max neval
f1(v) 2.890084 3.147535 3.296186 3.377536 3.667843 10
f2(v) 4.824832 5.625541 5.757534 5.918329 5.966332 10
model.matrix
比table
Unit: seconds
expr min lq median uq max neval
f1(v) 2.890084 3.147535 3.296186 3.377536 3.667843 10
f2(v) 4.824832 5.625541 5.757534 5.918329 5.966332 10
当然,您也可以只使用表
:
> table(sequence(length(playv)), playv)
playv
0 1 2 3 4 5
1 0 1 0 0 0 0
2 0 0 1 0 0 0
3 0 0 0 1 0 0
4 0 0 0 0 0 1
5 0 1 0 0 0 0
6 0 0 0 0 0 1
7 0 0 0 0 0 1
8 0 0 0 1 0 0
9 0 0 0 1 0 0
10 1 0 0 0 0 0
11 0 1 0 0 0 0
12 0 1 0 0 0 0
13 0 0 0 0 1 0
14 0 0 1 0 0 0
15 0 0 0 0 1 0
16 0 0 1 0 0 0
17 0 0 0 0 1 0
18 0 0 0 0 0 1
19 0 0 1 0 0 0
20 0 0 0 0 1 0
如果速度是一个问题,我会建议手动方法。首先,确定向量中的唯一值。第二,创建一个空矩阵来填充。第三,使用矩阵索引确定应填写为1的职位
像这样:
f3 <- function(vec) {
U <- sort(unique(vec))
M <- matrix(0, nrow = length(vec),
ncol = length(U),
dimnames = list(NULL, U))
M[cbind(seq_len(length(vec)), match(vec, U))] <- 1L
M
}
当然,您也可以只使用表
:
> table(sequence(length(playv)), playv)
playv
0 1 2 3 4 5
1 0 1 0 0 0 0
2 0 0 1 0 0 0
3 0 0 0 1 0 0
4 0 0 0 0 0 1
5 0 1 0 0 0 0
6 0 0 0 0 0 1
7 0 0 0 0 0 1
8 0 0 0 1 0 0
9 0 0 0 1 0 0
10 1 0 0 0 0 0
11 0 1 0 0 0 0
12 0 1 0 0 0 0
13 0 0 0 0 1 0
14 0 0 1 0 0 0
15 0 0 0 0 1 0
16 0 0 1 0 0 0
17 0 0 0 0 1 0
18 0 0 0 0 0 1
19 0 0 1 0 0 0
20 0 0 0 0 1 0
如果速度是一个问题,我会建议手动方法。首先,确定向量中的唯一值。第二,创建一个空矩阵来填充。第三,使用矩阵索引确定应填写为1的职位
像这样:
f3 <- function(vec) {
U <- sort(unique(vec))
M <- matrix(0, nrow = length(vec),
ncol = length(U),
dimnames = list(NULL, U))
M[cbind(seq_len(length(vec)), match(vec, U))] <- 1L
M
}
你在找模型矩阵吗?t(sapply(playv,函数(i){if(i!=0){c(rep(0,i-1),1,rep(0,max(playv)-i))}或者rep(0,max(playv))}或者你在找模型矩阵吗
google很难找到一个非常简单的解决方案。google很难找到一个非常简单的解决方案。很好的解决方案!但是比model.matrix稍微慢一点。我同意在这种情况下速度并不重要。但是,如果一个工作与大集,这可能会变得烦人。如果您能够超越model.matrix
您可以提出您的解决方案,以替代model.matrix
功能:杰出的我会根据需要使用它。:)很好的解决方案!但是比model.matrix稍微慢一点。我同意在这种情况下速度并不重要。但是,如果一个工作与大集,这可能会变得烦人。如果您能够超越model.matrix
您可以提出您的解决方案,以替代model.matrix
功能:杰出的我会根据需要使用它。:)