Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 python程序,计算每个位点的最大等位基因数_Python 2.7_Python 3.x_Genetic Algorithm_Genetic Programming_Genetic - Fatal编程技术网

Python 2.7 python程序,计算每个位点的最大等位基因数

Python 2.7 python程序,计算每个位点的最大等位基因数,python-2.7,python-3.x,genetic-algorithm,genetic-programming,genetic,Python 2.7,Python 3.x,Genetic Algorithm,Genetic Programming,Genetic,我正在尝试创建一个python程序,该程序将从我创建的文本文件中计算每个位点的最大等位基因数。下面是我正在使用的文本文件的一个示例 Locus1 Locus2 Locus3 Locus4 sample1 102 222 245 111 166 234 111 234 sample2 156 199 111 229 233 289

我正在尝试创建一个python程序,该程序将从我创建的文本文件中计算每个位点的最大等位基因数。下面是我正在使用的文本文件的一个示例

          Locus1           Locus2          Locus3           Locus4

sample1   102 222 245      111 166          234              111 234   

sample2   156 199          111 229 233 289  177 189          227 233 299 303
在这个例子中,我有两个样本,其中有四个基因座的遗传数据(我的文件包含大约500个样本)。遗传数据是发生在每个位点的等位基因。每个等位基因由三个数字组成。例如,在样本1和蝗虫1中有三个等位基因(102222245)。样本1/2有两个等位基因(111和166);样本1/3有一个等位基因(234);样本1/4有两个等位基因(111和234)

在下一个样本中,样本2/1有两个等位基因(156199);样本2/房室2有四个等位基因(111、229、233289);样本2/蝗虫3有两个等位基因(177189),样本2/蝗虫4有四个等位基因(227233299303)

我正在尝试创建一个python程序,该程序将查找在该样本中表达的等位基因(最大数量)最多的位点在样本1中,表达的大多数等位基因在蝗虫1中,因为它有3个等位基因,而蝗虫2和蝗虫4只有2个等位基因,蝗虫3只有1个等位基因。所以,我的输出数应该是3。在样本2中,表达的等位基因最多的是2号和4号蝗虫。在这两个基因座上有4个等位基因。所以我的输出数应该是4。理想情况下,我的最终输出文件应该是旁边有最大等位基因数的样本列表。比如说,

样本13

样本2 4

等等

此外,每个基因座由7个标签分开,每个基因座内的等位基因由一个标签分开


我为任何困惑道歉。我似乎不知道如何沿着一行数数某一组数字(文本文件中7个标签的倍数),并找出哪一组数字具有最高的一组数字。如果您有任何想法,我将不胜感激。

到目前为止您有什么代码?请访问stackoverflow.com/help/mcvemable replicate of