Python 如何在数据集中找到感兴趣的基因并打印所有值

Python 如何在数据集中找到感兴趣的基因并打印所有值,python,r,excel,pandas,bioinformatics,Python,R,Excel,Pandas,Bioinformatics,我的数据集如下所示: Gene baseMean log2FoldChange lfcSE stat pvalue padj 7SK 30.492 -0.892099279 0.4798019 -0.917210735 0.813808009 0.62064135 A1BG 2.8389 -0.916542309 0.5080946 -0.032557531 0.

我的数据集如下所示:

Gene       baseMean  log2FoldChange  lfcSE        stat           pvalue       padj

7SK         30.492  -0.892099279    0.4798019   -0.917210735    0.813808009  0.62064135

A1BG        2.8389  -0.916542309    0.5080946   -0.032557531    0.854027437  NA

A1BG-AS1    19.2657 -0.734784397    0.6184409   -0.056245298    0.355146396  0.976130671
然后我有另一个列表,其中我所有感兴趣的基因的名称都写在一列中:

Gene (e.g)
7Sk
ABL2
BMP
现在我的问题是,如果感兴趣的基因和数据集中的基因完全匹配,我如何提取数据集中存在的所有值的所有列

提前谢谢

R实现:

dat1[dat1$Gene%在%dat2$Gene中,]
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413
合并(dat1,dat2,by=“Gene”,all=FALSE)
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413
数据:


dat1你是说
dat1[dat1$Gene%在%dat2$Gene中,]
还是
merge(dat1,dat2,by=“Gene”)
?我使用了按基因合并,它工作得很好!非常感谢!:)我不知道为什么它被关闭(它不是没有焦点),也不知道为什么我不能重新打开它。oldboy12,如果它被重新打开,ping我,我会加上这个作为答案。我发现有趣的是,不同的标签社区有时会以不同的方式解释接近的原因。其中,我建议oldboy12添加代码,并可能(最终)基于VTC“寻求调试帮助但需要信息”,但“关注”并不是我的第一个想法。同样,在公司内部,看到“你尝试了什么”和VTC出于“怨恨”(从某种意义上说)并不罕见。谢谢@BigBen@oldboy12-堆栈溢出不是那样工作的。。。这很让人困惑,因为你的问题没有规定你想要哪一个解决方案。这就是为什么它看起来像是“标签垃圾邮件”。网站工作原理的一部分是,你应该先尝试一下,并显示出你在哪里遇到了问题。