R 在基于条件的迭代中,将一个值与数据帧中的所有值进行匹配
这是我实际数据集的一小部分R 在基于条件的迭代中,将一个值与数据帧中的所有值进行匹配,r,dataframe,nested-loops,rbind,cbind,R,Dataframe,Nested Loops,Rbind,Cbind,这是我实际数据集的一小部分 1 2 3 4 5 57.033 57.0332 57.0333 57.0339 57.03332 57.033 57.033 57.0335 59.0490 59.04901 59.0489 59.048 59.0490589 60.0806 60.08
1 2 3 4 5
57.033 57.0332 57.0333 57.0339 57.03332
57.033 57.033 57.0335 59.0490 59.04901
59.0489 59.048 59.0490589 60.0806 60.08
60.0805 60 60.08 60 60.08059
60.08053 60.080 60.08 61.0366 61.03947
具有相同结构的第二个矩阵
mz2
1 2 3 4 5
17.26 16.95225 17 17.84 17.79
14 141 143 632 629
630 63 631.337 241.5272 239
539 41 413 412 412
41 240 241 640 56
我需要将第1列中的第一个值与所有列中的所有值进行比较,如果它们符合我的条件,我应该将该值添加到该特定列的第一行。这将在迭代中发生。然后检查第1列中的第二行,并与所有列中的所有值进行匹配,如果它们符合条件,则将它们添加到特定列的第2行
我尝试使用for循环,但它非常混乱
这是我的尝试:
x.mz1<-matrix(0,5,5)
b1.mz=mz[,1] ##mz is my sample data above
b2.mz=mz2[,1]
for (i in length(b1.mz))
{
one.mz=b1.mz[i]
one.2=b2.mz[i]
for (j in 2:ncol(mz))
{
two.1=mz[,j]
two=mz2[,j]
for (k in 1:length(two.1))
{
sec.mz=two.1[k]
sec=two[k]
cond1[k]<-one.mz-two.1<0.000005
cond2[k]<-one.2-two<10
cond.check<-cbind(cond1[k],cond2[k])
cond.chc<-rbind(cond.check)
browser()
}
cond.chk.sum<-apply(cond.chc,1,sum)
sum.check<-sum(cond.chk.sum==2,na.rm=T)
if (sum.check==1)
{
x.mz1[i,j]=sec.mz
}
第一列是主矩阵中的我的第1列,所有其他列都将根据该列进行计算。如果我从所有匹配的行中找到一个值,那么我将它添加到该值所属的行和相应的列中。0的意思是没有与该列中所有行的第1列中的该值匹配的值 更新:我第一次尝试时只检查了下一列。我对起始数据做了一个小的修改并编辑了循环。见数值1.2 我不确定我是否完全理解你的要求,但这里有一个尝试
# generate data
v1 <- c(1.2, 5, 9, 13, 17)
v2 <- c(1, 1.3, 10, 14, 18)
v3 <- c(2, 6, 1.4, 15, 1.2)
v4 <- c(3, 7, 11, 1.5, 1.4)
v5 <- c(4, 8, 12, 16, 1.5)
dat <- as.data.frame(cbind(v1, v2, v3, v4, v5))
dat
v1 v2 v3 v4 v5
1 1.2 1.0 2.0 3.0 4.0
2 5.0 1.3 6.0 7.0 8.0
3 9.0 10.0 1.4 11.0 12.0
4 13.0 14.0 15.0 1.5 16.0
5 17.0 18.0 1.2 1.4 1.5
dat2 <- dat
for (r in 1:nrow(dat)) { # loop through rows
for (v in 1:length(dat)) { # loop through columns
v.check <- v + 1
while (v.check < length(dat)) {
if (dat[r,v] %in% dat[,v.check]==TRUE) {
dat2[r,v.check] <- dat[r,v]
v.check <- v
break
} else {
v.check <- v.check + 1
}
}
}
}
dat2
v1 v2 v3 v4 v5
1 1.2 1.0 1.2 3.0 4.0
2 5.0 1.3 6.0 7.0 8.0
3 9.0 10.0 1.4 1.4 12.0
4 13.0 14.0 15.0 1.5 16.0
5 17.0 18.0 1.2 1.4 1.5
#生成数据
v1数据。
# data
m1 <- structure(list(X1 = c(57.033, 57.033, 59.0489, 60.0805, 60.08053
), X2 = c(57.0332, 57.033, 59.048, 60, 60.08), X3 = c(57.0333,
57.0335, 59.0490589, 60.08, 60.08), X4 = c(57.0339, 59.049, 60.0806,
60, 61.0366), X5 = c(57.03332, 59.04901, 60.08, 60.08059, 61.03947
)), .Names = c("X1", "X2", "X3", "X4", "X5"), class = "data.frame", row.names = c(NA,
-5L))
m2 <- structure(list(X1 = c(17.26, 14, 630, 539, 41), X2 = c(16.95225,
141, 63, 41, 240), X3 = c(17, 143, 631.337, 413, 241), X4 = c(17.84,
632, 241.5272, 412, 640), X5 = c(17.79, 629, 239, 412, 56)), .Names = c("X1",
"X2", "X3", "X4", "X5"), class = "data.frame", row.names = c(NA,
-5L))
# first columns
m1.c1 <- m1[,1]
m2.c1 <- m2[,1]
# first condition
res1 <- lapply(m1.c1,FUN=function(x){x-m1[,-1] < 0.00005})
# second condition
res2 <- lapply(m2.c1,FUN=function(x){x-m2[,-1] < 10})
# getting final condition as logical
res <- lapply(seq_along(m1.c1), FUN=function(x)(res1[[x]] & res2[[x]]))
#数据
m1您能“dput
”矩阵和预期输出的一小部分吗?此外,还概述了更多的标准。(列差<0.000005,第二个矩阵差<10?)MZ1和mz2是整个矩阵的较小部分。整个矩阵是巨大的。我不确定如何最好地显示预期输出,但我会将其添加到问题中,如果不是很清楚,请让我知道。条件一为eg:mz1中的第1列第1列为57.033。此值应与col2到col5中的所有行进行比较。数据是这样的:对于每一列,只有一个值将同时匹配cond1和cond2。所以57.033-57.0332应该是一个小的、可重复的例子。请参阅以便更好地理解,例如,您需要在以下矩阵中找到==2
的行和列<代码>((mz2[1,1]-mz2[,-1])<10)+((mz[1,1]-mz[,-1])<0.000005)
。如果是,那么您提供的示例数据中有多个2
s。
# first columns
m1.c1 <- m1[,1]
m2.c1 <- m2[,1]
# first condition
res1 <- lapply(m1.c1,FUN=function(x){x-m1[,-1] < 0.00005})
# second condition
res2 <- lapply(m2.c1,FUN=function(x){x-m2[,-1] < 10})
# getting final condition as logical
res <- lapply(seq_along(m1.c1), FUN=function(x)(res1[[x]] & res2[[x]]))