R 仅保留仅复制一次的行_R_Duplicates

R 仅保留仅复制一次的行

R 仅保留仅复制一次的行,r,duplicates,R,Duplicates,我有一个如下所示的数据集： A B C liver 5 RX blood 9 DK liver 7 DK intestine 5 RX blood 3 DX blood 1 DX skin 2 RX skin 2 DX 我只想保留基于A的重复项（而不是重复三次等）。这意味着如果A中的值重复，则应打印整行理想的输出如下所示：

我有一个如下所示的数据集：

A         B      C 
liver     5      RX
blood     9      DK 
liver     7      DK
intestine 5      RX
blood     3      DX
blood     1      DX
skin      2      RX
skin      2      DX

我只想保留基于

的重复项（而不是重复三次等）。这意味着如果

中的值重复，则应打印整行

理想的输出如下所示：

A         B      C 
liver     5      RX
liver     7      DK
skin      2      RX
skin      2      DX

我尝试在dplyr中使用以下代码

df %>% group_by(A) %>% filter(n() >= 1)

有人能帮我吗？

你可以做：

df %>%
 group_by(A) %>%
 filter(n() == 2)

  A         B C    
  <chr> <int> <chr>
1 liver     5 RX   
2 liver     7 DK   
3 skin      2 RX   
4 skin      2 DX

或：

考虑到您可能希望基于“A”列的重复案例在其他方面是唯一的：

df %>%
 group_by(A) %>%
 distinct() %>%
 filter(n() == 2)

完美的非常感谢您的快速回复。如果这篇文章有帮助，请接受。

df %>%
 group_by(A) %>%
 filter(max(row_number()) == 2)

df %>%
 group_by(A) %>%
 distinct() %>%
 filter(n() == 2)