R 仅保留仅复制一次的行
我有一个如下所示的数据集:R 仅保留仅复制一次的行,r,duplicates,R,Duplicates,我有一个如下所示的数据集: A B C liver 5 RX blood 9 DK liver 7 DK intestine 5 RX blood 3 DX blood 1 DX skin 2 RX skin 2 DX 我只想保留基于A的重复项(而不是重复三次等)。这意味着如果A中的值重复,则应打印整行 理想的输出如下所示:
A B C
liver 5 RX
blood 9 DK
liver 7 DK
intestine 5 RX
blood 3 DX
blood 1 DX
skin 2 RX
skin 2 DX
我只想保留基于A
的重复项(而不是重复三次等)。这意味着如果A
中的值重复,则应打印整行
理想的输出如下所示:
A B C
liver 5 RX
liver 7 DK
skin 2 RX
skin 2 DX
我尝试在dplyr中使用以下代码
df %>% group_by(A) %>% filter(n() >= 1)
有人能帮我吗?你可以做:
df %>%
group_by(A) %>%
filter(n() == 2)
A B C
<chr> <int> <chr>
1 liver 5 RX
2 liver 7 DK
3 skin 2 RX
4 skin 2 DX
或:
考虑到您可能希望基于“A”列的重复案例在其他方面是唯一的:
df %>%
group_by(A) %>%
distinct() %>%
filter(n() == 2)
完美的非常感谢您的快速回复。如果这篇文章有帮助,请接受。
df %>%
group_by(A) %>%
filter(max(row_number()) == 2)
df %>%
group_by(A) %>%
distinct() %>%
filter(n() == 2)