R 索引与某些变量有关的重复项
我想在一个单独的新变量中为R中的某些变量的重复项编制索引。 假设我有以下数据集:R 索引与某些变量有关的重复项,r,if-statement,indexing,duplicates,R,If Statement,Indexing,Duplicates,我想在一个单独的新变量中为R中的某些变量的重复项编制索引。 假设我有以下数据集: a <- seq(from=0, to=1, by=.4) b <- seq(from=0, to=1, by=.4) c <- seq(from=0, to=1, by=.4) d <- seq(from=0, to=1, by=.4) df <- expand.grid(a=a, b=b, c=c, d=d) > df[1:20,] a b c d 1
a <- seq(from=0, to=1, by=.4)
b <- seq(from=0, to=1, by=.4)
c <- seq(from=0, to=1, by=.4)
d <- seq(from=0, to=1, by=.4)
df <- expand.grid(a=a, b=b, c=c, d=d)
> df[1:20,]
a b c d
1 0.0 0.0 0.0 0
2 0.4 0.0 0.0 0
3 0.8 0.0 0.0 0
4 0.0 0.4 0.0 0
5 0.4 0.4 0.0 0
6 0.8 0.4 0.0 0
7 0.0 0.8 0.0 0
8 0.4 0.8 0.0 0
9 0.8 0.8 0.0 0
10 0.0 0.0 0.4 0
11 0.4 0.0 0.4 0
12 0.8 0.0 0.4 0
13 0.0 0.4 0.4 0
14 0.4 0.4 0.4 0
15 0.8 0.4 0.4 0
16 0.0 0.8 0.4 0
17 0.4 0.8 0.4 0
18 0.8 0.8 0.4 0
19 0.0 0.0 0.8 0
20 0.4 0.0 0.8 0
a试试这个
df$e <- paste(df$a,df$b)
df$e试试这个
df$e <- paste(df$a,df$b)
df$e获得重复的行,如第10行、第11行
duplicated(df[,c(1,2)])
获取原始行,如第1行、第2行
duplicated(df[,c(1,2)], fromLast = TRUE)
将范围分配给新列中的原件和副本e
df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),"e"] <- paste0(df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),1],"-",df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),2])
> head(df)
a b c d e
1 0.0 0.0 0 0 0-0
2 0.4 0.0 0 0 0.4-0
3 0.8 0.0 0 0 0.8-0
4 0.0 0.4 0 0 0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4
df[重复(df[,c(1,2)],fromLast=TRUE)|重复(df[,c(1,2)],“e”]头部(df)
a、b、c、d、e
1 0.0 0.0 0 0 0-0
2 0.4 0.0 0 0 0.4-0
3 0.8 0.0 0 0 0.8-0
4 0.0 0.4 0 0 0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4
注意:在本例中,所有行都符合原始/重复标准,因此将范围指定给所有行
获取重复的行,如第10行、第11行
duplicated(df[,c(1,2)])
获取原始行,如第1行、第2行
duplicated(df[,c(1,2)], fromLast = TRUE)
将范围分配给新列中的原件和副本e
df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),"e"] <- paste0(df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),1],"-",df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),2])
> head(df)
a b c d e
1 0.0 0.0 0 0 0-0
2 0.4 0.0 0 0 0.4-0
3 0.8 0.0 0 0 0.8-0
4 0.0 0.4 0 0 0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4
df[重复(df[,c(1,2)],fromLast=TRUE)|重复(df[,c(1,2)],“e”]头部(df)
a、b、c、d、e
1 0.0 0.0 0 0 0-0
2 0.4 0.0 0 0 0.4-0
3 0.8 0.0 0 0 0.8-0
4 0.0 0.4 0 0 0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4
注意:在本例中,所有行都符合原始/重复标准,因此将范围指定给所有行
用因子
潜在地包装它,以获得与重复值关联的基础整数。你能给出一个例子吗?用因子
潜在地包装它,以获得与重复值关联的基础整数。你能给出一个例子吗?