R 索引与某些变量有关的重复项_R_If Statement_Indexing_Duplicates

R 索引与某些变量有关的重复项

r if-statement indexing

R 索引与某些变量有关的重复项,r,if-statement,indexing,duplicates,R,If Statement,Indexing,Duplicates,我想在一个单独的新变量中为R中的某些变量的重复项编制索引。假设我有以下数据集： a <- seq(from=0, to=1, by=.4) b <- seq(from=0, to=1, by=.4) c <- seq(from=0, to=1, by=.4) d <- seq(from=0, to=1, by=.4) df <- expand.grid(a=a, b=b, c=c, d=d) > df[1:20,] a b c d 1

我想在一个单独的新变量中为R中的某些变量的重复项编制索引。假设我有以下数据集：

a <- seq(from=0, to=1, by=.4)
b <- seq(from=0, to=1, by=.4)
c <- seq(from=0, to=1, by=.4)
d <- seq(from=0, to=1, by=.4)

df <- expand.grid(a=a, b=b, c=c, d=d)

> df[1:20,]
     a   b   c d
1  0.0 0.0 0.0 0
2  0.4 0.0 0.0 0
3  0.8 0.0 0.0 0
4  0.0 0.4 0.0 0
5  0.4 0.4 0.0 0
6  0.8 0.4 0.0 0
7  0.0 0.8 0.0 0
8  0.4 0.8 0.0 0
9  0.8 0.8 0.0 0
10 0.0 0.0 0.4 0
11 0.4 0.0 0.4 0
12 0.8 0.0 0.4 0
13 0.0 0.4 0.4 0
14 0.4 0.4 0.4 0
15 0.8 0.4 0.4 0
16 0.0 0.8 0.4 0
17 0.4 0.8 0.4 0
18 0.8 0.8 0.4 0
19 0.0 0.0 0.8 0
20 0.4 0.0 0.8 0

a试试这个
df$e <- paste(df$a,df$b)

df$e试试这个
df$e <- paste(df$a,df$b)

df$e获得重复的行，如第10行、第11行
duplicated(df[,c(1,2)])

获取原始行，如第1行、第2行
duplicated(df[,c(1,2)], fromLast = TRUE)

将范围分配给新列中的原件和副本e

df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),"e"] <- paste0(df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),1],"-",df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),2])

> head(df)
    a   b c d       e
1 0.0 0.0 0 0     0-0
2 0.4 0.0 0 0   0.4-0
3 0.8 0.0 0 0   0.8-0
4 0.0 0.4 0 0   0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4

df[重复（df[，c（1,2）]，fromLast=TRUE）|重复（df[，c（1,2）]，“e”]头部（df）
a、b、c、d、e
1 0.0 0.0 0 0     0-0
2 0.4 0.0 0 0   0.4-0
3 0.8 0.0 0 0   0.8-0
4 0.0 0.4 0 0   0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4

注意：在本例中，所有行都符合原始/重复标准，因此将范围指定给所有行
获取重复的行，如第10行、第11行
duplicated(df[,c(1,2)])

获取原始行，如第1行、第2行
duplicated(df[,c(1,2)], fromLast = TRUE)

将范围分配给新列中的原件和副本e

df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),"e"] <- paste0(df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),1],"-",df[duplicated(df[,c(1,2)], fromLast = TRUE) | duplicated(df[,c(1,2)]),2])

> head(df)
    a   b c d       e
1 0.0 0.0 0 0     0-0
2 0.4 0.0 0 0   0.4-0
3 0.8 0.0 0 0   0.8-0
4 0.0 0.4 0 0   0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4

df[重复（df[，c（1,2）]，fromLast=TRUE）|重复（df[，c（1,2）]，“e”]头部（df）
a、b、c、d、e
1 0.0 0.0 0 0     0-0
2 0.4 0.0 0 0   0.4-0
3 0.8 0.0 0 0   0.8-0
4 0.0 0.4 0 0   0-0.4
5 0.4 0.4 0 0 0.4-0.4
6 0.8 0.4 0 0 0.8-0.4

注意：在本例中，所有行都符合原始/重复标准，因此将范围指定给所有行
用因子
潜在地包装它，以获得与重复值关联的基础整数。你能给出一个例子吗？用因子
潜在地包装它，以获得与重复值关联的基础整数。你能给出一个例子吗？