BioPython中给定基因名称的基因的相似性

BioPython中给定基因名称的基因的相似性,python,similarity,biopython,Python,Similarity,Biopython,给定基因名,我如何找到两个基因的相似性? 相似性,我想我指的是序列的相似性。我是这个领域的新手,我的教授给了我这项工作。我不知道有多少相似之处 希望能用Biopython做到这一点 非常感谢你 更新为响应: 谢谢但是我试过了。 我的主要问题是,当我从数据库中检索基因序列时,一些结果是作为基因序列出现的,另一些结果是作为蛋白质序列出现的。我想如果我们想比较它们,我需要确保它们都是基因序列或者都是蛋白质序列,对吗 以下是我使用的代码: handle = Entrez.efetch(db="nucl

给定基因名,我如何找到两个基因的相似性? 相似性,我想我指的是序列的相似性。我是这个领域的新手,我的教授给了我这项工作。我不知道有多少相似之处

希望能用Biopython做到这一点

非常感谢你

更新为响应:
谢谢但是我试过了。
我的主要问题是,当我从数据库中检索基因序列时,一些结果是作为基因序列出现的,另一些结果是作为蛋白质序列出现的。我想如果我们想比较它们,我需要确保它们都是基因序列或者都是蛋白质序列,对吗

以下是我使用的代码:

 handle = Entrez.efetch(db="nucleotide", id=t ,rettype="gb")
 record = handle.read()
然后,对于一些ID,我得到了一个序列
agtc
,其他ID得到了一个序列,比如
mwvllvffll-tltylfwpkt
。它们是蛋白质,对吗


我被困在这里,不知道下一步该怎么办

首先,你应该通读包含所有基础知识的。您的问题非常简单(假设您已经知道如何使用Python编程):读取基因名称或登录ID,检索序列,对齐序列,然后生成摘要信息(身份百分比、同源性百分比、差距分数等)。教程和中介绍了所有这些功能。在处理单个类和方法时,也非常有用


祝你好运

如果你真的对此感兴趣,你应该了解e值的分数等含义。高分数和低e值对应着更好的相似性

你必须比较相同的类型,但是如果你想比较核苷酸和蛋白质,首先要把dna翻译成蛋白质

看看NCBI、ENSEMBL和EBI网站,它们几乎为您提供了所需的所有工具

如果你有很多序列需要比较,那么使用biopython是明智的,但首先要像MattDMo所说的那样理解这本食谱。通过互联网看看其他程序员是如何理解他们的代码的


祝你好运,谢谢@马特莫,我把问题改了一点,你能看一下吗?你是对的,有些是蛋白质,有些是核酸。在没有看到您的全部代码的情况下,我不确定您为什么会得到一个混合序列,但这可能与您使用的登录ID有关。我的建议是在Entrez网站上浏览一下,试着手动搜索你的输入,看看你会得到什么样的结果。例如,以
NP
开头的ID是蛋白质序列,而
NM
是DNA。您还可以在代码中执行一些健全性检查,这样,如果返回的序列包含氨基酸,而您只想比较DNA,那么它就会出错。