Python 如何在数据集中找到感兴趣的基因并打印所有值
我的数据集如下所示:Python 如何在数据集中找到感兴趣的基因并打印所有值,python,r,excel,pandas,bioinformatics,Python,R,Excel,Pandas,Bioinformatics,我的数据集如下所示: Gene baseMean log2FoldChange lfcSE stat pvalue padj 7SK 30.492 -0.892099279 0.4798019 -0.917210735 0.813808009 0.62064135 A1BG 2.8389 -0.916542309 0.5080946 -0.032557531 0.
Gene baseMean log2FoldChange lfcSE stat pvalue padj
7SK 30.492 -0.892099279 0.4798019 -0.917210735 0.813808009 0.62064135
A1BG 2.8389 -0.916542309 0.5080946 -0.032557531 0.854027437 NA
A1BG-AS1 19.2657 -0.734784397 0.6184409 -0.056245298 0.355146396 0.976130671
然后我有另一个列表,其中我所有感兴趣的基因的名称都写在一列中:
Gene (e.g)
7Sk
ABL2
BMP
现在我的问题是,如果感兴趣的基因和数据集中的基因完全匹配,我如何提取数据集中存在的所有值的所有列
提前谢谢 R实现:
dat1[dat1$Gene%在%dat2$Gene中,]
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413
合并(dat1,dat2,by=“Gene”,all=FALSE)
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413
数据:
dat1你是说dat1[dat1$Gene%在%dat2$Gene中,]
还是merge(dat1,dat2,by=“Gene”)
?我使用了按基因合并,它工作得很好!非常感谢!:)我不知道为什么它被关闭(它不是没有焦点),也不知道为什么我不能重新打开它。oldboy12,如果它被重新打开,ping我,我会加上这个作为答案。我发现有趣的是,不同的标签社区有时会以不同的方式解释接近的原因。其中,我建议oldboy12添加代码,并可能(最终)基于VTC“寻求调试帮助但需要信息”,但“关注”并不是我的第一个想法。同样,在公司内部,看到“你尝试了什么”和VTC出于“怨恨”(从某种意义上说)并不罕见。谢谢@BigBen@oldboy12-堆栈溢出不是那样工作的。。。这很让人困惑,因为你的问题没有规定你想要哪一个解决方案。这就是为什么它看起来像是“标签垃圾邮件”。网站工作原理的一部分是,你应该先尝试一下,并显示出你在哪里遇到了问题。