Python2.7大行读取文件

Python2.7大行读取文件,python,file,python-2.7,sequence,fasta,Python,File,Python 2.7,Sequence,Fasta,我有一个fasta文件,我只想打印序列 f = open ("NC_007970.fas",'r') for line in f: print line 它只打印第一行>NC\U 007970 我认为问题在于fasta文件本身,它由第一行“>”组成,第二行是序列,序列本身没有新行,长度约为19000个字符 > NC_007970 GTTATTGTAGCTTACACTAAAGCATGGCACTGAAGTTGCCAAGATGGGTAATCAAAATACCCCAAAAACACAAAGA

我有一个fasta文件,我只想打印序列

f = open ("NC_007970.fas",'r')
for line in f:
    print line
它只打印第一行
>NC\U 007970

我认为问题在于fasta文件本身,它由第一行“>”组成,第二行是序列,序列本身没有新行,长度约为19000个字符

> NC_007970
GTTATTGTAGCTTACACTAAAGCATGGCACTGAAGTTGCCAAGATGGGTAATCAAAATACCCCAAAAACACAAAGATTTGGTCCTAACCTTACTGTTACTTTTTGCTAAAATTACACATGCAAGTATCAGCATACCAGTGAAAACACCCTAGCAATCCTATTAGACAAAGGAGCCGGTATCAGGCACACCATGATAGCCCAAGACACCTAGCTTTGCCACACCCCCAAGGGCATTCAGCAGTGATAAAAATTAAGCAATAAGCGCAAGCTCGACTTAATTATAGCAAACATAGAGCTGGCCAATCTCGTGCCAGCCGCCGCGGTTATACAAGAAGCCCAAACTAACAGACAACCGGCGTAAAATGTGGCTAAAAATTTATCTACAAAATTAAGGCGAACCTACAACTTAACTGTTATACGCAAGTACACATTAATACATTATGAAAATAACCTTAACACAATAGAACTATTTGAACCCACTATCGCTAAGGCACAAACTGGGATTAGATACCCCACTATGCTCAGCCCTAAACTTAGATATTTACTTACAATAATATCCGCCAGAGAACTACGAGCCCAAACGCTTAAAACTCTAAAGACTTGGCGGTACCTCAACCTCCTAGAGGAGCCTGTTCTATAATCGATAATCCACGATCTACCTCACCATCCCTTGTCAATTCAGCCTATATACCACCGTCATTAGCTTACCCTGTGAAGGGTACCAAGTAAGCAAAATAACCTAAACAACTAGCAAGTCAGGTCAAGGTGTAGCTAACTGAGATGGAAGAAATGGGCTACATTTTCTTTATTAGAAATCACTTAACAGAAAGGACCATGAAATAAGTCCCATAAGTAGGATTTAGCAGTAAACTGGGAACAGAGAGCCCAATTTAAGTCGGTCCTGAGGTGCGCACACACCGCCCGTCACCCTCCTCAAATAATCCTTAAGCATAGATAAACCACAACAAACAAATAGATGAGGCAAGTCGTAACAAGGTAAGTGTACCGGAAGGTGTACTTGGAACATCAAAATATAGCTTATCAAAAGCACTCAGCTTACACCTGAAAGTTGTCCATTAAAATCGGATTATTTTGAGCAACTACCTAGCCCAACTAATAAATATAAAACCCAACAAACAAATTATCCTACCAATAAATCAACTAAAACATTTTACCATCATAGTATAGGAGATAGAAAAGATAATTGGAGCTATAAAGACAGTACCGCGAGGGAAAGATGAAAAACATGAAACACTCACCAAGCCAGAAAAAGCAAAGATTAACTCTTGTACCTTTTGCATCATGATTTAGCCAGTACATCCAAGCAAAGAGAACTAAAGTCTGAACTCCCGAAACCAAATGAGCTACTTAAAGGTAGCCTATACCACCATGGGCTAAATCCGTCTCTGTGGCAAAAGAGTGGAGAAACCTTTAAGTAGAGGTGAAAAGCCTAACGAACCTGGTGATAGCTGGTTGCTCAACAAAAGAATATCAGTTCAACCTTAAACCTCCTAACCTAACAACTTTGAAGTAATAGAAGAGAAGTTTAAGATATATTCAACAGGGGTACAGCCCTGTTGAAAAAGGGTACAACCTAAAATGCAGGACAAAACATCAAAGCAAGACCACAGTAGGCCTTAAAGCAGCCATCTCCAAAGAAAGCGTCAAAGCTCACTACAATTAATATCAACACAATTTTTTTCCCCTAAACAACATTGAGCTATTCTATCACCATAGAAGAACTAATGCTAAAATGAGTAACAAGAAGACGAAACTTCTCTTCCGCGCCAACTTAAATCATAATAGATAAACTACTGATTATTACAACCAATATTATAAGATCAACAGTACTTAATACACCATATAAACCCAACTGTTAACCCAACACAGGAGCGCACACAAGAAAGATTAAAATTTGTAAAAGGAACTAGGCAAACATTGAGCTCGACTGTTTACCAAAAACATAGCCCCTAGCAACAATAAGTATTAGGGGTAATGCCTGCCCAGTGACACTGTTCAACGGCCGCGGTATCCTAACCGTGCAAAGGTAGCGTAATCACTTGTCTTTTAAATAAGGACTAGAATGAACGGCTAAACGAGGTTCTACCTGTCTCTTACAAATAATCAGTGAAATTGGTCTTCCAGTGCAAAACCTGGAATAAAAATATAAGACGAGAAGACCCTGTGGAACTTTAAATACAAATCAATCTATTATTCATACCCACCCACGATGGTTTATCACCAATTAGCACATTGATCCATATTTTCGGTTGGGATGACCTCAGAGTAAAATTAAACCTCTGAACAAAGAACACACCTCCAAACCTAGACCCACCATTCAAAGTGCTTACAGCAAAATGATCCAATACACTTGATCAACGAACCAAGCTACCCCAGGGATAACAGCGCAATCCTATCCTAGAGTCCCTATCGACGATAGGGTTTACGACCTCGATGTTGGATCAGGACATCCTAATGGTGTAACCGCTATCAAGGGTTCGTTTGTTCAACGATTAATAGTCCTACGTGATCTGAGTTCAGACCGGAGTAATCCAGGTCGGTTTCTATCTATAAATGGGCTTTTTCTAGTACGAAAGGACCGAAAAGACAAGGCCTATTTTTAAAAACAAGCCTTACCTTATATTAGTGAAAGCAACTTAACTAATAATAAGGACAAACCATTTAACCCTAAAAAGGGGTTATTGAGGTGGCAGAGCCTGGTACAAAAGGCCTAAGCCCTTTACTCAGGGGTTCAAATCCCCTCCCCAATAATGAAAGCCCTATTATCAAACCTAATATCCCCACTTATATATATAATCCCAGTCTTAATTGCTGTAGCTTTCTTTACCTTAATTGAACGGAAAACTTTGGGATACATACAACTCCGAAAAGGCCCAAACATCGTAGGACCATGTGGACTTTTACAACCTGTAGCTGATGGTGTAAAACTATTTATTAAGGAACCAGTGTACCCATCAAACTCATCAACTATACTATTTACACTATCACCAATCCTAGCTCTACTACTATCTTTATCAGTCTGACTTCCACTGCCTCTACCATTTCCACTAGCCGACTTAAACCTAGGCCTCCTATTCCTAATTTCAATATCCAGCTTCATAGTTTACTCCATCTTATGATCTGGCTGAGCTTCAAACTCCAAGTACGCCTTAGTAGGGGCACTCCGGGCAGTAGCCCAAACTATCTCATACGAAGTAACCCTAGGAATCATCCTACTCTCCCTAATCCTATTCTCAGGCGGATTCAACATACAAACATTTATAACAACGCAGGAACCTGCGTACCTGATATTCTCATCCTGACCTTTAATAATAATATGGTATATCTCCACATTAGCAGAAACAAATCGAGCACCATTCGACCTTTCCGAAGGAGAATCTGAACTCGTATCAGGGTTTAACGTTGAATACGCCGCCGGCCCATTCGCCCTATTCTTCCTAGCAGAGTACGCTAATATTCTGATAATAAACACCCTCACCACTATCCTATTCCTGAATCCATCCCATATTAACAACACCCCCGAACTATTTTCATTATCATTAGTATCAAAAATAATACTACTCTCAGTAGGATTCCTATGAATCCGCGCCTCATACCCGCGATTCCGATATGACCAGTTAATACACTTATTATGAAAAAACTTCCTCCCTATTACCTTAGCAATGTGCCTCTGACATATATCTATGCCAACTGCCTTCTCGGGGCTACCACCGATGTTATAGGATACGTGCCTGAAATTAAAGGATCACCTTGATAAGGTGAATCATAGAGGCTAAACCCTCTCGTCTCCCTAAAAGAAAGCACCTTTACCTATAAATAACAAAATCCTATACCTGTATATTACTGTACTGAATTCATAAATTACACTACACACAATATTATCTAACCACAAATTAACACTCCATAAACCACTACATTAAAAATACAATATAGTACTATAACAGCATAACCCTTTATAAAATACCCTACAACCCATTTATAACATATATTATGAAATAAACTACCCCTTATTAAAATTACTAACAACTTCTCATAACAAACTACACAAAATCAAGCCAATATATCTTAATTTCTCGACTACAAACAATTTACCAACGTATTATCCCGTTACTTCCATAAATACACAATCCTTTTACCTAACAAACAAATTAAAACCAATTACCCTAACAGCAAAAAACACCAATATTCATCAAAAACCCCAACATATCTGAAAAATAAACTCCCTATTGTACTATTATAGGACCTAAAATACCCAAAACCCCTTTAGGTCAATATAGTTTAAAACAAACATTAGACTGTGATTCTAAAAATAGGAGTGTAAATCCCCTTATAGACCAAGAGAGATCCAACAGTAAGAACTGCTAATTCTTATACCTGAGACTAACACCTCAGCTCCCTTACTTTTAAAGGATAGAAGTAATCCACTGGTTTTAGGAACCATAAACCCTTGGTGCAACTCCAAGTAAAAGAACATGCCAACACCCCCACTGTTAGCCTTAACACATTTTATGACCCTAGCTATCCTGCTAGTTCCACTAGTAATCTCTATACTCACTACAAAAGTGTGAATTATTGAAAAGACAAAAACATCCGTGAAAACAGCGTTTTTTACCTCCATACTATCATTTCTCCTCTTTAAAGCTGAGTCCACCCCTTTCATAGTAATAGACTATAACCTATTAAGCACATCAACCTTCTATGTAAAGCTTAACTTTAAATTTGACCTATACTCCATACTATTTACACCAGTTGCCTTATACGTCTCATGATGTATTTTAGAGTTTTCACAATGATACATAGACAAAGACCCCTATCCCTCAAAATTCGCCAAATACCTACTAACCTTCATTATAGCTATAATAATCCTAGTATCAGCTAATAACCTACTCCTATTTTTTATTGGTTGGGAGGGGGTAGGAATCCTATCCTTCCTCCTAATCGCATGATGGCGAAACCGACCAAACACGAATACATCAGCCCTACAAGCTATTATCTACAACCGCATAGGAGACATCGGACTAATCTTATGTCTAGCATGACTAACAACACGCCTAAACACATTAGCACTCCAAAAAATCTTCACGTGTAATGACTTCATCACACTCCTACCATTACTAGGCCTTATCCTAGCTGCAATAGGCAAATCAGCCCAATTCGGCCTCCACCCCTGATTACCAGCAGCTATGGAAGGTCCAACCCCAGTCTCAGCGTTACTACACTCAAGTACTATGGTGGTCGCTGGCATTTTCCTACTAATCCGCATACACCCCGTATTAACCCTCAATAAATATGCTCTTTCAGCATGCCTGCTATTGGGAGCAATTACCTCATTAGTGGCAGCCTTTTGCGCTCTAACCCAAAATGATATTAAAAAAATCATTGCCTTCTCCACATCAAGCCAACTTGGCTTTATAATAGTAACCGTGGGCCTAGACCAACCACAACTAGCCTTCCTCCATCTCTCATTACACGCCTTCTTTAAAGCCATATTATTTCTATGCTCAGGTTCCATTATTCATAACCTTAATAACGAACAAGACATTCGAAAAATAGGCGGATTACATAAATGTTTACCCATCACCTCTGCATGCTTAACCATCGGCAGCATAGCGCTTGCAGGCACGCCATTCCTAACTGGATTCTACTCTAAAGATATTATTATCGAAACCATGACCACATCACATCTAAATGCTTTTGCCCTACTCATTACACTAATCGCAACCTCATTCACTGTGGTATACAGCCTGCGGATTACAATATTTGTACAAACAGGACAACCCCAACACATATCCATACTACTATTAGATGAATACAACCCGCTAGTTATCAACCCTATCATCCGCCTAGCTACAGGCAGCATTGCTGCCGGATTAATTATTTCAATAAACATTACACCGCTAGAAACCCCACCAATAACCATACCAACATACATTAAAACCGTAACATTAATGGTAGTAGCCCTAAGCCTCCTAATAGCCCTAAAACTAGCTACTATAACCAATAAAATACCCCCAAAATCATCCCACACCCATAACTTTTCCAACTCACTAATGTACTTTAATACCATAATTCACCGCTCAACACCAATAATTACTTCAACCATTAGTGAAAAATACTCAACCCGAATAATAGACTCAACCTGACAAGAAAAAATAGGCCCAAAAAAACTAGCTGAGTCACAAGTACTGCCTACTAAAACAACCTCTTCATTGCAAAAAGGCCTCATTAAAATTTATTTAACCTCATTTATCCTATCCGTCCTACTTCTTATTTACTTATTTGACTAATATACAAAACTAGTAAAATAAACATTACCCGCCGGATGTAATACGCTAAAAGGATATTACCCAAGATCTTAAAACCACTTCTCTAACTGCTAGGAACCAAAACCTTTTTACCCAAGTACCCACTATTTTTTAACCGCGCCTCACCATACATTCTAGTAGCTATCAACAAAGCATTGGTCTTGTAAACCAAAGACTGAAGACTATAATCTTCCTAGAATAATCAAAAGAGAAGGACTTAAACCTCCATTCCCGGCCCCCAAAACCGAAATCTTTTATTAAACTATCTTTTGACACCCCCCCCCCCCCCGATGGGCATGCTCATCGAATTTTGCCTAAATATAGGACAATTTACACCCTATGTACGTCGTGCATACTTTTATTTACCCCTAGCATATATTTAGTAATATCCCTGCTTAATCTTACATAAAAGTATATTCCCCATAATCTATCCAGATAACAGTAATTTAATGGTTTAAGGACATAATATTCTATAGTGCTTTACAACATGACTATTGTCACAGTATTGGGTTATTTCCTAATCTACCTAATCACGAGAGATAAGCAACCCTTGTTTGTAAGATACAACGTTACCAGTTTCAGGCCCATATTCATGATGGCGTACATAACTGATCTATTCTGGCCACTGGCTGTTTTTTCAGGCACATGTTATCCACTAAGTTCATTCGTTCCTCTTTAAAAGGCCTCTGGTTAAATGAGTTCTATACATTAAGTTAATAACTTGACATATGGTGGTCTTACTGGCATATAGTAGTTCTCTTTTTCTCTTTGTGTTCTCAGGCCCGCATAACTGATACCTGCCTACTCAATGAAACTGAGCCTACGTTCAAATGGTTAACCTTACATAATTGATATGGTATTATTTAGTTAATGCTTGTTAGACATATATTTTTATAAAAATTCACGACAGTAATTTTAAACCTAAACACTATAAACTATAATTTTTTAAGTTAAACCCCCCTACCCCCCGTTAAACTAACACCTAGTATGAATGGCCACTTATTTCTCGTCAAACCCCTAAATCCGAGAGCGACCAAACAGCATAAGCGTTAGTTATACAAATATCCTGAATATTTGTATTATATTAAATACACGCTACATTACCACAAACTTTTACCAAAAGTAATACACAAACAAATTTTATCCTACTTTACTAAACCCGCATAAACATTACACGCTTTAAATACTACTATATAAAAGACAAATAAAAATTTACCTTAATATAAAACACTGCAAAGCCACTAAATAAAATTAAAACTACTCAAAAATACAAACACAAGTAATAAACTCCAAAAACTCCCACCCACAACAATATACTCAACATATACCGCATACCAACACCTCTATTTAAACCTACCAAACACACCCCAGAAACTCAAAACATCACAAAGACTAGACCATCTAGTTTCCATAGAAAAATAGGTCTTGAACCTATACCAGAGAGATCAAAACTCCCCATACTTCCATTATACTACATCCTAGTAAAGTCAGCTAATTAAGCTCTTGGGCCCATACCCCAAAAATGTCGGTTAAAATCCTTCCTTTACTAATGAACCCACACGCAAGCATAATTATTACTTTAAGCCTAATTATAGGACCCCTAATCACCATCTCTAGTAATCATTGAATCCTAGCATGAACCGGATTAGAAATCAGCACCTTAGCTATTACCCCATTAATCGCCAAACAACACCACCCACGAGCAATTGAAGCCACCATTAAATACTTCCTGACACAAGCAACCGCCTCAACACTAATTCTATCCTCTAGCATTATTAATGCCTGAACACTGGGCCAATGAGACATCACACAAATGTCTAACAACACTTCATGCGCAATTCTAACCACAGCCCTAGCCATTAAATTAGGACTAGCACCCTTCCACTTCTGATTGCCAGAAGTCCTACAAGGAACTTCCACAACAACAGCCTTAATCCTAACTACCTGACAAAAATTAGCTCCTCTATCCCTACTAGTAATAACCACCCAATCCCTAAACACACCATTACTACTATTATTAGGATTAATATCCACCTTAGTTGGCGGATGGGGCGGACTAAACCAACCCCAACTACGAAAAATCATAGCATTCTCCTCCATCGCTCACCTAGGGTGAATAATTACAATCATTACTTTCTCACCTAAACTTATATTACTCACATTCTACACATACATTACTATAACTACAGCCATATTCCTCATAATTAAACTCCTAGAGACAAACAAAATCTCTATAATAATAACATCATGGACAAAACTACCAACACTAAACACCATCATAATTCTAATCCTTATGTCACTAGCCGGACTACCACCACTAACAGGGTTCATGCCCAAATGATTAATTCTTCAAGAACTAACCAAACAGCACATATTCATTATCGCCACCATAATAGCTCTACTCTCACTACTCAGCTTATTCTTCTACTTACGAATCTCATACTGCGCAACCATTACATTACCCCCAAACTCAACTAACTATTTACAACAATGACGTCACAAAACTAACCAAAAACCCTACCTAGCTCCAATAGCCACACTATCTATCACCCTGCTCCCTATCACACCTACCCTACTAACCCTCCTCTAGAAACTTAGGATCAAGCCAATTTTTAAACCGGGGGCCTTCAAAGCCCCAAAAAAGAGATAGAACCTCTTAGTTTCTGTTAAGACCTATAGGGCTCTATCCTATATCTTATGAATGCAACTCAGACACTTTAATTAAGCTAAAGTCTCACTAGACAAATGGGCCTCGATCCCATAAAAATTTAGTTAACAGCTAAACACCCAAATCCAGCGGGCTTTTATCTAATTTTCCCGCTCTCAGAAAAAGCGGGAAAACCCCGACACAAATCAAAGTGTATCTCCGAATTTGCAATTCGGAATGAATTTCACTACGAGGTTTGATAAGAAGAGGGGTTAAACCTCTATAAAAAGGTCTACAGCCTAACGCTTAAGCACTCAGCCATCTTACCTATGATTTTAACCCGCTGATTTTTTTCTACTAACCATAAAGACATTGGTACCTTATACCTTATTTTCGGGGCCTGATCAGGTATAATTGGCACAGCATTAAGTCTTTTGATCCGTGCCGAACTGAGCCAGCCAGGTACACTTCTTGGGGATGATCAGATCTACAATGTTATTGTTACGGCCCACGCTTTTGTTATAATCTTTTTCATAGTCATACCTGTTATGATCGGCGGGTTCGGAAACTGATTAGTTCCTTTAATAATTGGGGCGCCAGACATAGCATTCCCTCGTATAAACAATATAAGCTTCTGACTCCTACCTCCATCTCTACTGCTACTATTAATATCCTCTGGAATTGAAGCAGGTGCAGGTACCGGCTGAACTGTATACCCCCCACTAGCTGGGAATATGGCCCATTCCGGGGCCTCGGTAGACTTGACTATCTTTTCCCTTCACCTCGCCGGGGTGTCTTCAATCTTGGGGGCTATTAATTTTATCACCACAGCAATCAATATAAAATCTACAACCATGTCGCAGTACCAGACACCCCTATTCGTATGATCTGTACTCATTACAGCTATCTTATTACTACTCTCTTTACCTGTACTCGCCGCAGGGATCACTATATTACTTACAGACCGAAATCTGAATACAACTTTTTTTGACCCTTCAGGAGGGGGAGACCCCATCCTATACCAACACCTATTCTGATTCTTTGGTCACCCAGAAGTATACATTCTTATCCTACCTGGGTTTGGGATAATCTCACACATTGTAACCTGCTACGCAGGTAAAAAAGAACCATTTGGATATATAGGGATAGTGTGAGCAATAATATCCATTGGATTCCTGGGCTTTATTGTGTGAGCTCACCATATATTTACCGTTGGAATAGACGTAGACACCCGAGCCTATTTCACATCTGCAACAATAATTATTGCTATCCCAACAGGGGTAAAAGTATTTAGCTGATTAGCTACCTTGCATGGGGGAACAATCCAATGGGGGGCCGCCATAATATGGGCCCTAGGTTTCATTTTCCTATTCACCATCGGCGGACTAACAGGCATTGTACTGGCTAATTCATCTCTGGATATTGTACTCCATGATACTTACTATGTAGTAGCACACTTCCACTATGTTCTTTCAATAGGGGCCGTATTCGCCATTATAGCAGGATTTACCCATTGATTCACATTATTTACAGGATATCTATTACACCAAACCTGAACAAAAGTACACTTCGGATTAATATTTGCAGGCGTTAACATAACCTTCTTCCCTCAGCACTTCCTAGGCCTGGCAGGAATACCACGACGTTACTCTGACTACCCCGATGCATACACCCTATGAAATTCAATTTCGTCAATCGGATCATTAATTTCTCTAGTAGCAGTAATTATAATAATATTTATTATCTGAGAAGCATTTTGTTCAAAGCGTAAAATAGTATTAACTGAACTCAAAACTACAAACGTAGAGTGACTACACGGTTGCCCACCACCATACCACACTTATGAAGAACCAGCCCACATGCAAGTTCAAGAAAGGAGGGAATTGAACCCCCTTAAATTAGTTTCAAGCCAACTACATAACCTTTATGCTACCTTCTTCTAAAGACGTTAGTAAAATATATTACTAAACCTTGTCAAGGTTAAATTATAAGTGAAACCCCTATACGCCTTAATGGCCCACCCGCTGCAACTAGGATTCCAGGACGCAATATCACCCGTTATAGAAGAACTCCTTCACTTTCATGACCATACCCTAATAATTGTATTTTTAATCAGCACCTTAGTGCTCTACATCATTACACTAATAATAACAACAAAACTAACATACACTAACACTATAAATGCTCAAGAAGTGGAAATAATTTGAACTATTCTACCAGCAATTGTCCTAATCACCATTGCACTCCCCTCCCTACGAGTCTTGTACTTAATAGATGAAATTAATAACCCGCATTTAACAATTAAAACCATAGGACATCAATGATACTGAACGTACGAGTATACTGACTACGAAAACCTTGAGTTTGACTCTTACATGATCCATGCCCAAGATCTACCAAACGGGTACTTTCGATTATTAGAAGTAGACCACCGCATGGTCATACCAATAGAATCGCCAATCCGAATTCTAATCTCGGCTGAAGACGTCCTACACTCATGAGCAATCCCATCATTAGGTGTAAAAACAGACGCAGTGCCCGGACGATTGAACCAAACAACTTTCATTATTACACGACCAGGAATATTCTACGGACAATGTTCAGAAATCTGCGGGGCTAACCATAGCTTCATGCCAATTGTGGTAGAATCTGTGCCACTACAATACTTCGAAAACTGATCTTCACTAATACTCTCCTAACCACTATAGAAGCTAAACAGGATAGCGCTAGCCTTTTAAACTAGAGAAAGAGAATTCCCCACCCTCCTTAGTGACATGCCACAACTAAATCCAGACCCTTGATTCTTAATTCTGTCTCTCGCATGATTAACCTACATTCTCGTCCTACAACCAAAAATTCTATCCAACAAGTCTATAAATCACCCAACCAACAAAAACAACGAAATTATTAAAACAAACCCATGAACATGACCATGACCCTAACCATAAACCTAACATTTTTTAATCAATTCACAAGCCCGCAAATCATAGGAGTTCCATTAATTATACTCGCTCTATTAGCACCATCAGCCATGTTCCAAACCCAAAACAACCGATGGTTAACTAACCGTCTTTCATTACTCCAATTATGAATAATTAACCTATTCACAAAACAACTAATATCGCCCATTAGTAAAACAGGACATCAGTGATCCGTTATCTTAACATCACTAATAATTATACTCTTAATAATTAATCTGCTAGGACTTCTACCATATACATTCACCCCTACAACACAACTCTCCATAAATATAGGACTAGCCATCCCAATATGATTAGCCACAGTACTAACAGGCCTTCGAAACCAACCAACTGCATCACTAGGACACCTTCTACCAGAAGGGACCCCAAACCTATTAACCCCAATCCTCATCATCATTGAAACTATTAGCCTTTTTATCCGACCATTAGCCCTAGGTGTACGACTTACAGCCAATCTTACAGCTGGCCACCTATTAATTCAACTTACTTCTACCGCAACATTTGCTTTACTCCCAACAATACCAACCTTATCTATGCTAACCATAGTTGTACTATTATTATTATCTATTCTAGAACTAGCAGTAGCAATAATTCAAGCCTACGTCTTCGTCTTATTACTAAGCCTCTACCTTCAAGAAAACACCTAATGACCCACCAAACTCATGCCTACCACATAGTAGACCCTAGCCCATGACCATTAACAGGCGCAGCAGCATCATTACTAATAACCTCTGGGTTCGCCATGTGATTTCACCATAACTCAATACTACTAATAACCCTAGGTTTATTAACTATACTACTGACTATACTCCAGTGATGACGAGACATTGTTCGAGAAGGAACCTTCCAAGGCCATCACACCACTCCAGTACAGAAAAGCCTACGATACGGTATAATCCTATTCGTCACGTCAGAAGTATTCTTTTTTATTGGATTCTTCTGAGCTTTCTACCACTCAAGCCTGTCCCCCACACCAGAATTAGGGGGATGTTGACCACCAACAGGAATTTCTCCACTAAATCCATTTGAAGTACCACTGTTGAATACAGCAGTCTTACTGGCCTCAGGGGTAACAATTACCTGAGCCCACCATAGCCTGATAGAAGTCAACCGACACCAGACTATCCAAGCCCTTATATTAACAGTTTTACTAGGTTTGTACTTCACAACCCTACAAGCCCTGGAGTACTACGAAGCCCCGTTTACAGTTGCTGACGGTGTGTACGGCTCTACATTTTTTATTGCAACAGGCTTTCACGGACTCCACGTAATTATTGGATCAACATTTCTAATCGTATGCCTGATACGGCAAATAAAATTCCACTTCACCTCCGCCCATCACTTCGGATTCGAAGCATCCGCTTGATACTGACACTTTGTAGATGTTGTATGACTATTCCTTTATGTATCAATCTACTGATGAGGCTCATACTCTTCTAGTACAAAATAGTACCAGTGACTTCCAATCACTAAATTTTAGCTATACCCTAAAGAAGAGTAATGAACGTAACAATCTCCATTATAACAATCGCCCTCATCCTATCAGTAGTTTTAATAACACTGAACTATTGATTAACACTAGTAAAACCAAACAACGAAAAACTATCCCCATACGAATGCGGCTTCGATCCATTAGAATCAGCTCGTTTACCATTCTCAATCCAATTTTTTCTCAGTAGCAATCTTATTCTTACTATTTGATTTAGAAATCGCATTACTCTTACCTCTACCATGAGCTATTCAACTGTTATCACCAACCTACACCTTCACCTGAGCACTTATAATCCTACTACTTCTAACATTGGGCCTCATTTATGAATGAGTTCAAGGGGGCTTGGAATGGGCAGAATTGATAACTAGTCTAACACAAGACAACTAATTTCGACTTAGTTAATCATGATTAAATCCATGGTTATCCAATGACACCATTACATTTTAGCTATCTCTCTGCTTTTATTGTTAGCATCATAGGCCTCTCACTACATCGAACCTACCTTATCTCCACCCTATTATGCTTAGAAAGCATAATATTATCCATATTTATTGCCCTATCAATATGACCTATCCAACTACAAACTTCATCATTTATACTCACTCCCATACTAATACTATCCTTCTCAGCCTGCGAAGCAGGCACCGGCCTATCCTTACTTGTGGCATCCTCACGAACCCATGGTTCAGACCACTTACAAAACTTAAACCTATTACAATGCTAAAAATCATACTTCCAACCATTATATTATTACCCACAACTATGCTCTGCAAACCAAAACAACTATGAATCACTATATTAACCCATAGTTTTGGGATTGCCTTTTTAAGCCTACAGTGATTTAAACCCTCCATGGAATTTACAAGCTTCTCCAACCATTACTTAGGGGTAGACCAAATTTCAGCCCCATTACTCATCTTAACATGCTGACTCAGCCCACTAATAGTCCTGGCCAGTCAAAACCACTTGACTAAAGAACCAGTTACACGAAAACGAACCTTTATCTCCACTATTATTCTACTACAAACCTCATTAATCCTGGCCTTCTCTGCCACAGAACTAATCATATTCTTCATAGCATTTGAAGCTACACTGATTCCAACACTAGTAATTATTACACGCTGAGGAAACCAAATAGAACGGCTAAATGCTGGAACCTATTTCCTATTCTACACTCTTATTGGATCCCTCCCCCTACTAATTGCCCTCCTTTCACTTCATACCCAAAATGGAACCCTATCCCTCTGTACTATTCAACTCAACCAACACGCCATATTAAATTCATGAACCCACACAACATGATGATTTGCATTACTAACAGCCTTCATAATCAAAATACCATTGTATGGGCTACATCTATGACTACCAAAAGCACACGTAGAAGCTCCAATCGCAGGGTCAATAATCCTAGCAGCTGTACTTCTCAAACTCGGGGGGTATGGCATTATCCGTATTATAATAACTCTAGATCCTTTATCAAAAACACTCTCTTATCCATTTATAGTCCTAGCTCTATGGGGAGTAGTCATAACCAGTTCAATCTGCTTACACCAAACAGACCTAAAATCACTAATCGCTTACTCATCAGTAAGTCACATAGGACTAGTCACTGCCGCAGCACTAACCCAAACCCACTGAGCCCATACTGGAGCAATCACACTCATAATCGCCCACGGTCTAACATCATCAATACTCTTTTGCCTAGCAAACACAAACTATGAGCGAACCCACAACCGAACATTATTAATTGCCCGAAATATGCAACTATTCCTGCCACTAATGGGGACATGATGACTACTTGCCAGCCTAGCAAACATAGCCATCCCACCGACGATTAACTTAATAGGAGAACTAACTATTATTGCCTCATTATTCAACTGATCCAACATTACAATCCTAATAACAGGGTTAGGAACTTTACTCACTGCTACCTACACCTTACATATACTATCTACAACACAATGAGGAAAGACACCCTCATATATTAAAACTATCCCTCCAACTCACACACGAGAACATTTACTGATGGCACTCCACACTATACCCATAGCACTATTAATAGTAAAACCAGAACTAATCTGAGGGGCCTTTCACTGTACTATATTCCTAAAATAAATATTAGATATAGGAGTTTAAATCTCCTTATAGACCCAAAAGTAATAAAAACTCACCCAATATTTAAAACCACCTTTCCCCACTCCCAAAAAGAGAAAAAACCTAATGTTTCAAAACTATCAATGCAATTCCAAGTAATACCGCACCCATAGCCTTAGCCTAACATTACTTACCCTAATACTACCGTATATAATACTCTCCATTTAAGCATAAAACAACACCTTCCACAATCCTGACACAACTCTTTACATCTATAAACACTGAACTTATCATACTTAACCCAAAATTACCTACTACATCACGCACAAACACACACTACTTTAAACTAACCCCCACTACCTCACATAACACACCACCCTACACCCTATCAGATTCACTTTAAAATTTTTCATCTCCACACAACCTAAACGATTAGAAACTCACCAAACACCTATTAATAGCCCTAATAATAACTAATAATTTAATTTTTTTAAATAATAGACAAAAATCACATTACTACTTATAATTGAACAATAACAAAGCTGACCAAACAACTTACTACAACCTCACACATACCCATTAAGAACTTACCTGCCTTCCTTACCCAATCTTACACTTCTTCACAGTACTCTAATCGCACGAAGCACTCCACGAGACAAACCACGAACCAATTCCAACACAACAAACAATGTTAACAATAGCCCTCAACCAGCAATCAAAAAAATTACATTGCCCAAATAATAAAATCATGACACTCCACTAAAATCCAGCCGAACCACACATAATCCACCAGCATCAACTGTGATATGACCAAACCCTTCGGTACCCCACAACCAATGACCAATAACTACAAGTCCAATAATAACTAAAACATAAACCACCATATACACCACCCCCCACAAACTCCCTCAACCAATAGGATATGGCTCCGCAACTAATGCAGCCGAATAAGCAAAAATTACCAATATCCCTCCCAAATAAATTAAAAACAACACTAAAGAAACAAAAGACCCCCCAACACTTACCAACACCCCACACCCAGAAGCCGCACCCAGGATTAAACTTAAAACTCCGTAATAAGGCGACGGATTACAAGACACACCCACCATTCAAAAAACAAAACAAAACCCAAATAAAAATATAAAATATATCATAATTCTTGCATGGACTTTAACCAAGACTAATGATCTGAAAAACCACTGTTGTATTCAACTACAAAAACCTAATGACCACAAATACACGAAAAACCCACCCTATAATAAAAATTATCAACAACTCATTCATTGACCTACCAAGCCCGTCTAATATCTCTGCTTGATGAAACTTCGGATCACTACTAGGTATCTGCCTAATTTTACAAATTATCACTGGAATTTTCCTAGCAATACACTACTCACCAGACGTCTCCCTGGCATTTTCATCAATTACACACATCTCTCGAGATGTACAATACGGATGACTTATTCGCAACATACACGCTAATGGTGCCTCCTTATTCTTCATGTACATCTATATCCACATCGGACGAGGACTATACTACGGCTCATACTTGTACAAAGAGACATGAAACACAGGGATCATTCTTCTACTACTAACTATAGCCACCGCGTTCGTAGGTTATGTTCTCCCATGGGGCCAAATATCATTCTGAGGCGCTACTGTAATCACCAACCTACTCTCAGCTATTCCATATATGGGCAGCACATTAGTACAGTGGATTTGAGGGGGGTTTTCAGTGGACAACGCAACCTTAACCCGATTCTTTACCTTCCATTTTCTTTTACCATTCATTACTTCCGGCTTCGCAATAGTACATCTTCTATTTCTGCATGAGACAGGATCAAACAACCCAACAGGATTAAACTCAAACACTGATAAAATCCCCTTCCACCCGTACTTTTCATATAAAGACTTACTAGGAATTATCCTAACACTAGCCTTACTACTAACCCTCGCACTATTCTCCCCAAATCTTTTAGGAGACCCTGACAACTTTACACCAGCCAACCCTCTATCCACTCCTCCCCATATTAAACCAGAATGATACTTCCTCTTCGCTTATGCAATCCTACGATCAATTCCTAACAAACTAGGTGGCGTACTTGCCCTCCTATTAGCTATCCTTATATTACTCCTAATACCTATCCTACATACATCAAAACAACGAACCACATCATTCCGACCACTAACCCAAATCCTCTTCTGATTCTTAGTTGCTGACCTATTAGTACTAACGTGAATCGGGGGACAGCCAGTTGAAGCCCCGTTCACCGCCATCAGCCAAATAGCCTCTATCCTATACTTCTTAATCCCATTAATCTTAATGCCTACCACAGGCGTAATCGAAAACAAAATACTAAACCTAAAATACTCTAGTAGCACACCCCACTAAAGCACTGGCCATAAACCAAAGACTGAAGACTATAATCTTCCTAGAGTAATCAAAAGAGAAGGACTTAAACCTCCATTCCCGGCCCCCAAAATCGAAATCTTTTATTAAACTATATTTTGACCCCCCCCCCCCCCGATGGGCATGCTCATCGAATTTTGCCTAAATATAGGACAATTTACACCCTATGTACGTCGTGCATACTTTTATTTACCCCTAGCATATATTTAGTAATATCCCTGCTTAATCTTACATAAAAGTATATTCCCCATAATCTATCCAGATAACAGTAATTTAATGGTTTAAGGACATAATATTCTATAGTGCTTTACAACATGACTATTGTCACAGTATTGGGTTATTTCCTAATCTACCTAATCACGAGAGATAAGCAACCCTTGTTTGTAAGATACAACGTTACCAGTTTCAGGCCCATATTCATGATGGCGTACATAACTGATCTATTCTGGCCACTGGCTGTTTTTTCAGGCACATGTTATCCACTAAGTTCATTCGTTCCTCTTTAAAAGGCCTCTGGTTAAATGAGTTCTATACATTAAGTTAATAACTTGACATATGGTGGTCTTACTGGCATATAGTAGTTCTCTTTTTCTCTTTGTGTTCTCAGGCCCGCATAACTGATACCTGCCTACTCAATGAAACTGAGCCTACGTTCAAATGGTTAACCTTACATAATTGATATGGTATTATTTAGTTAATGCTTGTTAGACATATATTTTTATAAAAATTCACGACAGTAATTTTAAACCTAAACACTATAAACTATAATTTTTTAAGTTAAACCCCCCTACCCCCCGTTAAACTAACACCTAGTATGAATGGCCACTTATTTCTCGTCAAACCCCTAAATCCGAGAGCGACCAAACAGCATAAGCGTTAGTTATACAAATATCCTGAATATTTGTATTAATGTTACAGCAATAAATTTATTATGTTATACTATGTTATAGTATAGTGTGTGTTATATAATATATGTTGTTATATAATATATGTTGTTATATAATATATGTTGTTATATAATATATGTTGTTATATAATATATGTTGTTATATAATATGTGTTGTTATATAATATGTGTTGTTATATAATATAT

如何从这样的文件中获取序列???

AWRAM,我建议您查看
BioPython
软件包好吗

我将使用以下特定代码来执行您尝试执行的操作:

from Bio import SeqIO

file = open('NC_007970.fas', r)
for record in SeqIO.parse(file, "clustal") :
    print record.seq
file.close()

BioPython将把每个FASTA文件解析为SeqRecord对象的迭代器,从中可以查询每个SeqRecord的序列,并使用它来处理其他事情。

首先,在您提供的代码示例中,
seq
什么都不做,因此可以省略它。第二,程序是在打印第二行之前返回(即结束),还是挂起(即仍处于活动状态,但没有响应)?如果是后者,那么python将尝试打印它,但这是一条庞大的行。你最好把它打印成块。你给我的行对我来说很好…我使用了你用Python2.7发布的代码来阅读你在这里提供的示例数据。它打印文件的两行。你在什么平台上运行这个:Linux、Windows、Mac或其他什么?文件的最后一行是否可能缺少一个尾随换行符,这会混淆您的输出?@AWRAM是的,Python 2.7.6。如果你将打印行替换为
打印行,'test'
,文本
test
会打印在下一行吗?我也是一名处理病毒序列的生物学家,BioPython软件包在这方面非常有用。我在使用它,它会在这里产生同样的问题,即序列的长度。。。上面的代码不打印任何内容,仅打印记录就给出(ID:NC_007970名称:NC_007970说明:NC_007970功能数量:0 Seq('GTTATTGTAGCTTACAACTAAAGCATGGCACTGAGTAATCA…TAT',SingleLetterAlphabet())我明白了,奥拉姆。你想看整个序列有什么原因吗?我向你保证,即使序列没有完全打印到屏幕上(为了节省空间),它肯定会被完全保存在内存中。