R 通过频率在病毒整合的人类基因上找到病毒基因的位置

R 通过频率在病毒整合的人类基因上找到病毒基因的位置,r,bioinformatics,genetics,R,Bioinformatics,Genetics,我有一个病毒基因以数据框或文本文件的形式整合了人类基因,如: "C""G""C""T""G""T""T""G""T""T"... 它有50000个核苷酸长。我也有病毒基因数据框,我发现了它的标准差和平均频率。我正试图通过将人类基因分成1000个核苷酸长片段,并通过频率和标准偏差值找到该病毒基因的大致位置。你仍然可以在R,而且这比自己尝试用频率等来做要容易得多/准确得多。它仍然使用一些相同的原则。将为您提供许多详细的示例,说明如何在R中执行此操作。在本页的一半左右是与您的问题直接相关的示例。您不

我有一个病毒基因以数据框或文本文件的形式整合了人类基因,如:

"C""G""C""T""G""T""T""G""T""T"...

它有50000个核苷酸长。我也有病毒基因数据框,我发现了它的标准差和平均频率。我正试图通过将人类基因分成1000个核苷酸长片段,并通过频率和标准偏差值找到该病毒基因的大致位置。

你仍然可以在R,而且这比自己尝试用频率等来做要容易得多/准确得多。它仍然使用一些相同的原则。将为您提供许多详细的示例,说明如何在R中执行此操作。在本页的一半左右是与您的问题直接相关的示例。

您不只是将两个序列对齐的特殊原因是什么?你的最终目标是什么?我的目标是找到病毒基因在人类基因组上的位置。所以在整个基因组中,而不仅仅是一个给定的基因?那么你对你感兴趣的样本进行了全基因组测序吗?我的意思是这是一个包含50000个核苷酸的基因病毒基因,是的。但你是在整个人类基因组中寻找它,还是在单个基因中寻找它?你的问题不清楚:“我正试图通过将人类基因分成1000个核苷酸的长片段来找到这种病毒基因的大致位置。”