如何在R中使用grep函数根据样本名称查找相关性_R

如何在R中使用grep函数根据样本名称查找相关性

如何在R中使用grep函数根据样本名称查找相关性,r,R,我有两个数据框，有关于基因的信息。这两个数据帧具有相同的尺寸（20000行x 50列）。我有另一个名为info的文件，其中包含这些数据帧之间匹配的主题名称。我想从文件（info）中对名称进行grep处理，以找到匹配主题之间的相关系数。以下是这些文件的示例： df1 gene_name loc1 loc2 ......... loc50 gene1 1 23 25 gene2 24 15

我有两个数据框，有关于基因的信息。这两个数据帧具有相同的尺寸（20000行x 50列）。我有另一个名为info的文件，其中包含这些数据帧之间匹配的主题名称。我想从文件（info）中对名称进行grep处理，以找到匹配主题之间的相关系数。以下是这些文件的示例：

df1
gene_name    loc1  loc2 .........  loc50
gene1        1        23              25
gene2        24       15              67

df2
gene_name    loc1  loc2 .........  loc50
gene1        21       31              55
gene2        2       65              89

info file
subject     loc_in_df1   loc_in_df2
1                loc1          loc2
2                loc3          loc46

试试下面的方法

首先，根据信息文件从

df1

和

df2

中提取列，构建

df

df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2])

1:50和51:100假设您的信息文件中有50对，但这只是猜测，因为您没有提供可复制的样本

我不明白，您能根据示例发布预期输出吗？@user6617454。我编辑了这个示例以获得更多的澄清。我想在这里根据info文件查找df1和df2中匹配的colname，然后查找这两列之间的相关系数。具有列的预期结果有50个corr系数。

cor = apply(df, MARGIN = 1, FUN = function(x) return(cor.test(x[1:50], x[51:100])$estimate))