Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/video/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 聚合在这里做什么?_R_Aggregate - Fatal编程技术网

R 聚合在这里做什么?

R 聚合在这里做什么?,r,aggregate,R,Aggregate,我有一个带有以下行的R脚本: KSData.dataset.abbrev = aggregate(log2FC ~ Kinase.Gene+Substrate.Gene+Substrate.Mod+Source, data=KSData.dataset.abbrev, FUN=mean) KSData.dataset.abbrev如下所示: Kinase.Gene Substrate.Gene Substrate.Mod Peptide

我有一个带有以下行的R脚本:

KSData.dataset.abbrev = aggregate(log2FC ~ Kinase.Gene+Substrate.Gene+Substrate.Mod+Source, data=KSData.dataset.abbrev, FUN=mean)
KSData.dataset.abbrev如下所示:

    Kinase.Gene Substrate.Gene Substrate.Mod                          Peptide           p        FC       log2FC          Source
364        ABL1          RBM39           Y95                        YRSPYSGPK 0.019590948 1.6158045  0.692252615 PhosphoSitePlus
8          AKT1         AKT1S1          T246                         LNTSDFQK 0.800879536 0.8909224 -0.166628324 PhosphoSitePlus
121        AKT1          EPHA2          S897                    LPSTSGSEGVPFR 0.500658346 0.7052020 -0.503891606 PhosphoSitePlus
使用上述代码行后,df看起来类似于:

    Kinase.Gene Substrate.Gene Substrate.Mod          Source        log2FC
430        ABL1          RBM39           Y95 PhosphoSitePlus  0.6922526152
19         AKT1          PEA15          S116 PhosphoSitePlus  1.1782441053
80         AKT1           MDM2          S166 PhosphoSitePlus -0.7967537534
我不知道这条线到底是干什么的。。。
感谢您的帮助

我计算了独特组组合Kinase.Gene、
substance.Gene
substander.Mod
Source的
log2FC
平均值

使用一个小数据示例,您可以看到
aggregate
正在做什么:

(tt  <- data.frame(a = 1:2, b=1:3, x=1:12))
#   a b  x
#1  1 1  1
#2  2 2  2
#3  1 3  3
#4  2 1  4
#5  1 2  5
#6  2 3  6
#7  1 1  7
#8  2 2  8
#9  1 3  9
#10 2 1 10
#11 1 2 11
#12 2 3 12

aggregate(x ~ a, data=tt, FUN=mean) #Average for the groups in col a
#  a x
#1 1 6
#2 2 7

aggregate(x ~ a + b, data=tt, FUN=mean) #Average for the groups in col a and b
#  a b x
#1 1 1 4
#2 2 1 7
#3 1 2 8
#4 2 2 5
#5 1 3 6
#6 2 3 9

(你看过手册了吗:
?RStudio中的聚合
?但是我如何才能为三个不同的组每行只得到一个
log2FC
值?如果我只使用
Kinase.Gene
作为组参数,这很简单。它将它们分组并计算平均值。但是如果有另一组……另一组的平均值是用t计算的吗第一组的平均值只有一个log2FC?