R 根据另一列中的条件筛选重复项_R

R 根据另一列中的条件筛选重复项

R 根据另一列中的条件筛选重复项,r,R,我想过滤我的数据框，删除“Gene”中的重复ID，只保留“Pval”最低的ID。请看我的例子：在出去我们可以使用： library(dplyr) df %>% group_by(Gene) %>% filter(Pval==min(Pval)) %>% unique() 从可能的选项中选择Pval的标准是什么，例如基因puc 0.01 vs 0.3？看起来您需要类似于dplyr:：group_by（df，Gene）%%>%dplyr:：summary

我想过滤我的数据框，删除“Gene”中的重复ID，只保留“Pval”最低的ID。请看我的例子：

在

出去

我们可以使用：

library(dplyr)

df %>% 
  group_by(Gene) %>% 
  filter(Pval==min(Pval)) %>% 
  unique()

从可能的选项中选择Pval的标准是什么，例如基因puc 0.01 vs 0.3？看起来您需要类似于

dplyr:：group_by（df，Gene）%%>%dplyr:：summary（Pval=min（Pval，na.rm=T））%%>%dplyr:：ungroup（）

查找Gene buc的所有Pval并保留最小值不确定为什么

adad

会被过滤掉。@NelsonGon，拼写错误，现在更正

Gene Pval
buc  0.01
abad 0.0002
myc  0.1
p53  0.03

library(dplyr)

df %>% 
  group_by(Gene) %>% 
  filter(Pval==min(Pval)) %>% 
  unique()