R 根据另一列中的条件筛选重复项

R 根据另一列中的条件筛选重复项,r,R,我想过滤我的数据框,删除“Gene”中的重复ID,只保留“Pval”最低的ID。请看我的例子: 在 出去 我们可以使用: library(dplyr) df %>% group_by(Gene) %>% filter(Pval==min(Pval)) %>% unique() 从可能的选项中选择Pval的标准是什么,例如基因puc 0.01 vs 0.3?看起来您需要类似于dplyr::group_by(df,Gene)%%>%dplyr::summary

我想过滤我的数据框,删除“Gene”中的重复ID,只保留“Pval”最低的ID。请看我的例子:

出去

我们可以使用:

library(dplyr)

df %>% 
  group_by(Gene) %>% 
  filter(Pval==min(Pval)) %>% 
  unique()

从可能的选项中选择Pval的标准是什么,例如基因puc 0.01 vs 0.3?看起来您需要类似于
dplyr::group_by(df,Gene)%%>%dplyr::summary(Pval=min(Pval,na.rm=T))%%>%dplyr::ungroup()
查找Gene buc的所有Pval并保留最小值不确定为什么
adad
会被过滤掉。@NelsonGon,拼写错误,现在更正
Gene Pval
buc  0.01
abad 0.0002
myc  0.1
p53  0.03
library(dplyr)

df %>% 
  group_by(Gene) %>% 
  filter(Pval==min(Pval)) %>% 
  unique()