R 识别重复行
我有一个更大的数据帧(约50K行和50到75列),其中有少量行在75列中的7列中重复。虽然使用R 识别重复行,r,dataset,matching,R,Dataset,Matching,我有一个更大的数据帧(约50K行和50到75列),其中有少量行在75列中的7列中重复。虽然使用duplicated(…)查找上面重复行的行非常简单,但我希望能够提取重复行和重复行,或者(从以前的帖子中窃取) a a <- c(rep("A", 3), rep("B", 3), rep("C",2)) b <- c(1,1,2,4,1,1,2,2) d <- c('x','y','x','z','y','y','z','x') df <- data.frame(a,b,d)
duplicated(…)
查找上面重复行的行非常简单,但我希望能够提取重复行和重复行,或者(从以前的帖子中窃取)
a
a <- c(rep("A", 3), rep("B", 3), rep("C",2))
b <- c(1,1,2,4,1,1,2,2)
d <- c('x','y','x','z','y','y','z','x')
df <- data.frame(a,b,d)
df
a b d
1 A 1 x
2 A 1 y
3 A 2 x
4 B 4 z
5 B 1 y
6 B 1 y
7 C 2 z
8 C 2 x
which(duplicated(df[,1:2])|duplicated(df[,1:2],fromLast=T))
#[1] 1 2 5 6 7 8