R 如何计算每个基因的关联数

R 如何计算每个基因的关联数,r,R,我有一个来自eqtl分析和MatrixEQTL的输出文件: SNP gene beta t-stat p-value FDR ch01_76563780 GW_06g072920 0.049942008791647 932.306067766817 2.2250738585072e-308 1.60416093688267e-302 ch02_36905357 GW_06g072920 -0.049942008791647 -932.30606

我有一个来自
eqtl
分析和
MatrixEQTL
的输出文件:

SNP gene    beta    t-stat  p-value FDR
ch01_76563780   GW_06g072920    0.049942008791647   932.306067766817    2.2250738585072e-308    1.60416093688267e-302
ch02_36905357   GW_06g072920    -0.049942008791647  -932.306067766817   2.2250738585072e-308    1.60416093688267e-302
ch07_69573723   GW_06g072920    0.049942008791647   932.306067766817    2.2250738585072e-308    1.60416093688267e-302
ch01_87880392   GW_06g072920    0.0499413219745195  923.819795644165    2.2250738585072e-308    1.60416093688267e-302

我试图计算每个基因之间的关联,以获得重要的基因进行总结。如有任何建议,我将不胜感激。谢谢大家!

好的,那么关联本质上就是数据中某个特定基因的行数? 然后就可以简单地按基因分组并计数了

library(magrittr)
eqtl %>% 
  dplyr::group_by(gene) %>%
  dplyr::summarise(Associations = dplyr::n())

# here is a small example with a toy df
tibble::tibble(SNPS = 1:4, Gene = "testgene") %>% 
  dplyr::group_by(Gene) %>% 
  dplyr:::summarise(Associations = dplyr::n())
这能行吗,让我知道


祝你好运:)

你好,用户1567654,你如何定义关联?如果要遵循公式,则对按“基因”分组的数据执行该操作。e、 g.数据%>%dplyr::按(基因)分组%>%dplyr::汇总(结果=您的关联公式)。祝你好运。嗨@Jagge,谢谢你!这里的每一行代表一个关联。我想看看每个基因的输出中有多少SNP(第1列)。对于EAX来说,基因GW_06g072920在原始问题中有4个相关的SNP。它起作用了,谢谢!不过我还有一个后续问题。我想使用for循环定义一个窗口(每个方向10000 bp)来计算任何SNP。这就是有一个SNP,那么我不计算每个方向10000 bp左右的任何其他SNP,以便于总结。你有什么建议吗?很高兴它奏效了,请将答案标记为正确,这样其他人可以快速浏览页面并知道问题得到了回答(我也得到了甜点),你可能会通过发布新问题得到最好的帮助。但也许可以这样做:for(i in 1:(nrow(eqt1)-10000)){df_tmp谢谢!我会尝试你的建议或发布另一个问题。你能帮我将结果绘制成x轴上类似于条形图的基因和y轴上的关联数吗。