R 按另一列中的唯一值删除重复项
我有一个如下所示的数据帧:R 按另一列中的唯一值删除重复项,r,duplicates,dplyr,R,Duplicates,Dplyr,我有一个如下所示的数据帧: COLA COLB COLC A nb 1 A nc 0.8 A bc 0.7 A nb 0.7 <------------ B nb 1 B nc 0.3 <------------ B n
COLA COLB COLC
A nb 1
A nc 0.8
A bc 0.7
A nb 0.7 <------------
B nb 1
B nc 0.3 <------------
B nc 0.8
B aa 0.9
我们可以使用
dplyr
。在排列
并向下排列“COLA”和“COLC”之后,我们按“COLA”、“COLB”分组,并使用切片
获得第一行
library(dplyr)
df1 %>%
arrange(COLA, desc(COLC)) %>%
group_by(COLA, COLB) %>%
slice(1L)
除了重复标记中的一个外,基本R方法是
df1[!duplicated(df1[c(1,3)],]
另一个可能的重复:在删除重复之前,如何从COLA和COLB中的重复行的c列中提取最大值,以便删除正确的行?@akrun
library(dplyr)
df1 %>%
arrange(COLA, desc(COLC)) %>%
group_by(COLA, COLB) %>%
slice(1L)