Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 识别重复行_R_Dataset_Matching - Fatal编程技术网

R 识别重复行

R 识别重复行,r,dataset,matching,R,Dataset,Matching,我有一个更大的数据帧(约50K行和50到75列),其中有少量行在75列中的7列中重复。虽然使用duplicated(…)查找上面重复行的行非常简单,但我希望能够提取重复行和重复行,或者(从以前的帖子中窃取) a a <- c(rep("A", 3), rep("B", 3), rep("C",2)) b <- c(1,1,2,4,1,1,2,2) d <- c('x','y','x','z','y','y','z','x') df <- data.frame(a,b,d)

我有一个更大的数据帧(约50K行和50到75列),其中有少量行在75列中的7列中重复。虽然使用
duplicated(…)
查找上面重复行的行非常简单,但我希望能够提取重复行和重复行,或者(从以前的帖子中窃取)

a
a <- c(rep("A", 3), rep("B", 3), rep("C",2))
b <- c(1,1,2,4,1,1,2,2)
d <- c('x','y','x','z','y','y','z','x')
df <- data.frame(a,b,d)
df
  a b d
1 A 1 x
2 A 1 y
3 A 2 x
4 B 4 z
5 B 1 y
6 B 1 y
7 C 2 z
8 C 2 x
which(duplicated(df[,1:2])|duplicated(df[,1:2],fromLast=T))
#[1] 1 2 5 6 7 8