Python 每一百万个特定字符的数量
首先,我使用的是Python 我试图找出染色体中每百万个字符中特定字符(碱基对)的数量 例如: 我希望a、g、t和c以及a、g、t和c在导入的文件中出现的次数 到目前为止,我可以使用“计数器”来计算整个文件中这些字符的数量,但我不知道如何将每一百万个字符分解一次Python 每一百万个特定字符的数量,python,split,character,Python,Split,Character,首先,我使用的是Python 我试图找出染色体中每百万个字符中特定字符(碱基对)的数量 例如: 我希望a、g、t和c以及a、g、t和c在导入的文件中出现的次数 到目前为止,我可以使用“计数器”来计算整个文件中这些字符的数量,但我不知道如何将每一百万个字符分解一次 提前谢谢 如果导入文件看起来像字符序列: AGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTC 然后您可以应用此方法: file = 'c:\\test\\chromosome.txt' aCount = [] g
提前谢谢 如果导入文件看起来像字符序列: AGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTCAGTC 然后您可以应用此方法:
file = 'c:\\test\\chromosome.txt'
aCount = []
gCount = []
tCount = []
cCount = []
ACount = []
GCount = []
TCount = []
CCount = []
step = 1000000
start = 0
end = step
with open(file, 'r') as chromosome:
data = chromosome.read()
while end < len(data):
aCount.append(data.count('a', start, end))
gCount.append(data.count('g', start, end))
tCount.append(data.count('t', start, end))
cCount.append(data.count('c', start, end))
ACount.append(data.count('A', start, end))
GCount.append(data.count('G', start, end))
TCount.append(data.count('T', start, end))
CCount.append(data.count('C', start, end))
start = end
end += step
file='c:\\test\\chromose.txt'
A账户=[]
gCount=[]
t计数=[]
帐户=[]
A账户=[]
GCount=[]
t计数=[]
帐户=[]
步长=1000000
开始=0
结束=步骤
将打开的(文件“r”)作为染色体:
数据=染色体。读取()
而end
最后你会得到8个列表。每个列表将包含每百万个特定字符的出现次数。不完全确定您的要求。但是你不能简单地把结果除以一百万吗?或者。。。除以总数再乘以一百万。这是一个家庭作业问题吗?我不能将结果数除以一百万,因为这将给出平均数,而不是前一百万中的具体字符数。抱歉,如果有点模糊,我对编程有点陌生!