R 识别重复行_R_Dataset_Matching

R 识别重复行

R 识别重复行,r,dataset,matching,R,Dataset,Matching,我有一个更大的数据帧（约50K行和50到75列），其中有少量行在75列中的7列中重复。虽然使用duplicated（…）查找上面重复行的行非常简单，但我希望能够提取重复行和重复行，或者（从以前的帖子中窃取） a a <- c(rep("A", 3), rep("B", 3), rep("C",2)) b <- c(1,1,2,4,1,1,2,2) d <- c('x','y','x','z','y','y','z','x') df <- data.frame(a,b,d)

我有一个更大的数据帧（约50K行和50到75列），其中有少量行在75列中的7列中重复。虽然使用

duplicated（…）

查找上面重复行的行非常简单，但我希望能够提取重复行和重复行，或者（从以前的帖子中窃取）

a
a <- c(rep("A", 3), rep("B", 3), rep("C",2))
b <- c(1,1,2,4,1,1,2,2)
d <- c('x','y','x','z','y','y','z','x')
df <- data.frame(a,b,d)
df
  a b d
1 A 1 x
2 A 1 y
3 A 2 x
4 B 4 z
5 B 1 y
6 B 1 y
7 C 2 z
8 C 2 x

which(duplicated(df[,1:2])|duplicated(df[,1:2],fromLast=T))
#[1] 1 2 5 6 7 8