Python 2.7 python程序,计算每个位点的最大等位基因数
我正在尝试创建一个python程序,该程序将从我创建的文本文件中计算每个位点的最大等位基因数。下面是我正在使用的文本文件的一个示例Python 2.7 python程序,计算每个位点的最大等位基因数,python-2.7,python-3.x,genetic-algorithm,genetic-programming,genetic,Python 2.7,Python 3.x,Genetic Algorithm,Genetic Programming,Genetic,我正在尝试创建一个python程序,该程序将从我创建的文本文件中计算每个位点的最大等位基因数。下面是我正在使用的文本文件的一个示例 Locus1 Locus2 Locus3 Locus4 sample1 102 222 245 111 166 234 111 234 sample2 156 199 111 229 233 289
Locus1 Locus2 Locus3 Locus4
sample1 102 222 245 111 166 234 111 234
sample2 156 199 111 229 233 289 177 189 227 233 299 303
在这个例子中,我有两个样本,其中有四个基因座的遗传数据(我的文件包含大约500个样本)。遗传数据是发生在每个位点的等位基因。每个等位基因由三个数字组成。例如,在样本1和蝗虫1中有三个等位基因(102222245)。样本1/2有两个等位基因(111和166);样本1/3有一个等位基因(234);样本1/4有两个等位基因(111和234)
在下一个样本中,样本2/1有两个等位基因(156199);样本2/房室2有四个等位基因(111、229、233289);样本2/蝗虫3有两个等位基因(177189),样本2/蝗虫4有四个等位基因(227233299303)
我正在尝试创建一个python程序,该程序将查找在该样本中表达的等位基因(最大数量)最多的位点在样本1中,表达的大多数等位基因在蝗虫1中,因为它有3个等位基因,而蝗虫2和蝗虫4只有2个等位基因,蝗虫3只有1个等位基因。所以,我的输出数应该是3。在样本2中,表达的等位基因最多的是2号和4号蝗虫。在这两个基因座上有4个等位基因。所以我的输出数应该是4。理想情况下,我的最终输出文件应该是旁边有最大等位基因数的样本列表。比如说,
样本13
样本2 4
等等
此外,每个基因座由7个标签分开,每个基因座内的等位基因由一个标签分开
我为任何困惑道歉。我似乎不知道如何沿着一行数数某一组数字(文本文件中7个标签的倍数),并找出哪一组数字具有最高的一组数字。如果您有任何想法,我将不胜感激。到目前为止您有什么代码?请访问stackoverflow.com/help/mcvemable replicate of