Python 每一百万个特定字符的数量_Python_Split_Character

Python 每一百万个特定字符的数量

python

Python 每一百万个特定字符的数量,python,split,character,Python,Split,Character,首先，我使用的是Python 我试图找出染色体中每百万个字符中特定字符（碱基对）的数量例如：我希望a、g、t和c以及a、g、t和c在导入的文件中出现的次数到目前为止，我可以使用“计数器”来计算整个文件中这些字符的数量，但我不知道如何将每一百万个字符分解一次提前谢谢如果导入文件看起来像字符序列： AGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTC 然后您可以应用此方法： file = 'c:\\test\\chromosome.txt' aCount = [] g

首先，我使用的是Python

我试图找出染色体中每百万个字符中特定字符（碱基对）的数量

例如：

我希望a、g、t和c以及a、g、t和c在导入的文件中出现的次数

到目前为止，我可以使用“计数器”来计算整个文件中这些字符的数量，但我不知道如何将每一百万个字符分解一次

提前谢谢

如果导入文件看起来像字符序列：

AGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTC

然后您可以应用此方法：

file = 'c:\\test\\chromosome.txt'

aCount = []
gCount = []
tCount = []
cCount = []
ACount = []
GCount = []
TCount = []
CCount = []

step = 1000000
start = 0
end = step

with open(file, 'r') as chromosome:
    data = chromosome.read()

while end < len(data):
  aCount.append(data.count('a', start, end))
  gCount.append(data.count('g', start, end))
  tCount.append(data.count('t', start, end))
  cCount.append(data.count('c', start, end))
  ACount.append(data.count('A', start, end))
  GCount.append(data.count('G', start, end))
  TCount.append(data.count('T', start, end))
  CCount.append(data.count('C', start, end))

  start = end
  end += step

file='c:\\test\\chromose.txt'
A账户=[]
gCount=[]
t计数=[]
帐户=[]
A账户=[]
GCount=[]
t计数=[]
帐户=[]
步长=1000000
开始=0
结束=步骤
将打开的（文件“r”）作为染色体：
数据=染色体。读取（）
而end


最后你会得到8个列表。每个列表将包含每百万个特定字符的出现次数。
不完全确定您的要求。但是你不能简单地把结果除以一百万吗？或者。。。除以总数再乘以一百万。这是一个家庭作业问题吗？我不能将结果数除以一百万，因为这将给出平均数，而不是前一百万中的具体字符数。抱歉，如果有点模糊，我对编程有点陌生！