Python 如何在数据集中找到感兴趣的基因并打印所有值_Python_R_Excel_Pandas_Bioinformatics

Python 如何在数据集中找到感兴趣的基因并打印所有值

python r excel pandas

Python 如何在数据集中找到感兴趣的基因并打印所有值,python,r,excel,pandas,bioinformatics,Python,R,Excel,Pandas,Bioinformatics,我的数据集如下所示： Gene baseMean log2FoldChange lfcSE stat pvalue padj 7SK 30.492 -0.892099279 0.4798019 -0.917210735 0.813808009 0.62064135 A1BG 2.8389 -0.916542309 0.5080946 -0.032557531 0.

我的数据集如下所示：

Gene       baseMean  log2FoldChange  lfcSE        stat           pvalue       padj

7SK         30.492  -0.892099279    0.4798019   -0.917210735    0.813808009  0.62064135

A1BG        2.8389  -0.916542309    0.5080946   -0.032557531    0.854027437  NA

A1BG-AS1    19.2657 -0.734784397    0.6184409   -0.056245298    0.355146396  0.976130671

然后我有另一个列表，其中我所有感兴趣的基因的名称都写在一列中：

Gene (e.g)
7Sk
ABL2
BMP

现在我的问题是，如果感兴趣的基因和数据集中的基因完全匹配，我如何提取数据集中存在的所有值的所有列

提前谢谢

R实现：

dat1[dat1$Gene%在%dat2$Gene中，]
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413
合并（dat1，dat2，by=“Gene”，all=FALSE）
#基因基平均数log2FoldChange lfcSE stat pvalue padj
#1 7SK 30.492-0.8920993 0.4798019-0.9172107 0.813808 0.6206413

数据：

dat1你是说dat1[dat1$Gene%在%dat2$Gene中，]
还是merge（dat1，dat2，by=“Gene”）
？我使用了按基因合并，它工作得很好！非常感谢！：）我不知道为什么它被关闭（它不是没有焦点），也不知道为什么我不能重新打开它。oldboy12，如果它被重新打开，ping我，我会加上这个作为答案。我发现有趣的是，不同的标签社区有时会以不同的方式解释接近的原因。其中，我建议oldboy12添加代码，并可能（最终）基于VTC“寻求调试帮助但需要信息”，但“关注”并不是我的第一个想法。同样，在公司内部，看到“你尝试了什么”和VTC出于“怨恨”（从某种意义上说）并不罕见。谢谢@BigBen@oldboy12-堆栈溢出不是那样工作的。。。这很让人困惑，因为你的问题没有规定你想要哪一个解决方案。这就是为什么它看起来像是“标签垃圾邮件”。网站工作原理的一部分是，你应该先尝试一下，并显示出你在哪里遇到了问题。