R 根据另一列中的条件筛选重复项
我想过滤我的数据框,删除“Gene”中的重复ID,只保留“Pval”最低的ID。请看我的例子: 在 出去 我们可以使用:R 根据另一列中的条件筛选重复项,r,R,我想过滤我的数据框,删除“Gene”中的重复ID,只保留“Pval”最低的ID。请看我的例子: 在 出去 我们可以使用: library(dplyr) df %>% group_by(Gene) %>% filter(Pval==min(Pval)) %>% unique() 从可能的选项中选择Pval的标准是什么,例如基因puc 0.01 vs 0.3?看起来您需要类似于dplyr::group_by(df,Gene)%%>%dplyr::summary
library(dplyr)
df %>%
group_by(Gene) %>%
filter(Pval==min(Pval)) %>%
unique()
从可能的选项中选择Pval的标准是什么,例如基因puc 0.01 vs 0.3?看起来您需要类似于
dplyr::group_by(df,Gene)%%>%dplyr::summary(Pval=min(Pval,na.rm=T))%%>%dplyr::ungroup()
查找Gene buc的所有Pval并保留最小值不确定为什么adad
会被过滤掉。@NelsonGon,拼写错误,现在更正
Gene Pval
buc 0.01
abad 0.0002
myc 0.1
p53 0.03
library(dplyr)
df %>%
group_by(Gene) %>%
filter(Pval==min(Pval)) %>%
unique()