如果键列值与dplyr(R)重复,则获取平均值

如果键列值与dplyr(R)重复,则获取平均值,r,dplyr,R,Dplyr,这是我的数据。我想做的是,如果基因列有重复的值(例如,CASZ1),那么我想得到每个样本列的平均值 输入数据 输出数据 我在谷歌上搜索并尝试了一下,但我一直想得到答案。我很抱歉问了这样一个问题,这个问题看起来和家庭作业一模一样 我的代码 data %>% group_by(gene) %>% summarise(avg = mean(colnames(data)) --- error... 您可以使用汇总所有内容: library(dplyr) data %>% grou

这是我的数据。我想做的是,如果基因列有重复的值(例如,
CASZ1
),那么我想得到每个样本列的平均值

输入数据

输出数据

我在谷歌上搜索并尝试了一下,但我一直想得到答案。我很抱歉问了这样一个问题,这个问题看起来和家庭作业一模一样

我的代码

data %>% group_by(gene) %>% summarise(avg = mean(colnames(data)) --- error...

您可以使用
汇总所有内容

library(dplyr)
data %>% group_by(gene) %>% summarise_all(funs(mean))

您可以使用
汇总所有内容

library(dplyr)
data %>% group_by(gene) %>% summarise_all(funs(mean))

您可以使用
summary_at
和一些正则表达式来确保不包括任何不以模式开头的列:

data %>% group_by(gene) %>% summarise_at(vars(matches("Sample")), mean)

这就是您要查找的内容吗?

您可以使用
summary\u at
以及一些正则表达式来确保不包含任何以您的模式开头的列:

data %>% group_by(gene) %>% summarise_at(vars(matches("Sample")), mean)

这就是你要找的吗?

谢谢!我应该读更多关于dplyr的内容。谢谢!我应该读更多关于dplyr的内容。谢谢。我不知道我可以在dplyr中使用正则表达式。很高兴知道,谢谢。我不知道我可以在dplyr中使用正则表达式。很高兴知道。