BioPython中给定基因名称的基因的相似性_Python_Similarity_Biopython

BioPython中给定基因名称的基因的相似性

python

BioPython中给定基因名称的基因的相似性,python,similarity,biopython,Python,Similarity,Biopython,给定基因名，我如何找到两个基因的相似性？相似性，我想我指的是序列的相似性。我是这个领域的新手，我的教授给了我这项工作。我不知道有多少相似之处希望能用Biopython做到这一点非常感谢你更新为响应：谢谢但是我试过了。我的主要问题是，当我从数据库中检索基因序列时，一些结果是作为基因序列出现的，另一些结果是作为蛋白质序列出现的。我想如果我们想比较它们，我需要确保它们都是基因序列或者都是蛋白质序列，对吗以下是我使用的代码： handle = Entrez.efetch(db="nucl

给定基因名，我如何找到两个基因的相似性？相似性，我想我指的是序列的相似性。我是这个领域的新手，我的教授给了我这项工作。我不知道有多少相似之处

希望能用Biopython做到这一点

非常感谢你

更新为响应：
谢谢但是我试过了。
我的主要问题是，当我从数据库中检索基因序列时，一些结果是作为基因序列出现的，另一些结果是作为蛋白质序列出现的。我想如果我们想比较它们，我需要确保它们都是基因序列或者都是蛋白质序列，对吗

以下是我使用的代码：

 handle = Entrez.efetch(db="nucleotide", id=t ,rettype="gb")
 record = handle.read()

然后，对于一些ID，我得到了一个序列

agtc

，其他ID得到了一个序列，比如

mwvllvffll-tltylfwpkt

。它们是蛋白质，对吗

我被困在这里，不知道下一步该怎么办

首先，你应该通读包含所有基础知识的。您的问题非常简单（假设您已经知道如何使用Python编程）：读取基因名称或登录ID，检索序列，对齐序列，然后生成摘要信息（身份百分比、同源性百分比、差距分数等）。教程和中介绍了所有这些功能。在处理单个类和方法时，也非常有用

祝你好运

如果你真的对此感兴趣，你应该了解e值的分数等含义。高分数和低e值对应着更好的相似性

你必须比较相同的类型，但是如果你想比较核苷酸和蛋白质，首先要把dna翻译成蛋白质

看看NCBI、ENSEMBL和EBI网站，它们几乎为您提供了所需的所有工具

如果你有很多序列需要比较，那么使用biopython是明智的，但首先要像MattDMo所说的那样理解这本食谱。通过互联网看看其他程序员是如何理解他们的代码的

祝你好运，谢谢@马特莫，我把问题改了一点，你能看一下吗？你是对的，有些是蛋白质，有些是核酸。在没有看到您的全部代码的情况下，我不确定您为什么会得到一个混合序列，但这可能与您使用的登录ID有关。我的建议是在Entrez网站上浏览一下，试着手动搜索你的输入，看看你会得到什么样的结果。例如，以

NP

开头的ID是蛋白质序列，而

NM

是DNA。您还可以在代码中执行一些健全性检查，这样，如果返回的序列包含氨基酸，而您只想比较DNA，那么它就会出错。