Perl 从核苷酸序列的每个核苷酸位置提取给定长度的所有子串_Perl

Perl 从核苷酸序列的每个核苷酸位置提取给定长度的所有子串

perl

Perl 从核苷酸序列的每个核苷酸位置提取给定长度的所有子串,perl,Perl,如何用Perl语言从fasta文件中读取DNA序列并将其存储在数组中，然后从每个核苷酸位置提取给定长度的所有子字符串？我的意思是我想读一个非常大的序列然后从每个核苷酸位置开始将其拆分成许多序列这意味着第一个序列从第一个核苷酸开始到第七十个核苷酸然后第二个序列从第二个核苷酸开始到第七十一个，依此类推。利用Bioperl的捆绑分布，我举了一个例子（如果这是你想要的）请提供一些例子，你到底在寻找什么，并展示一些代码，到目前为止尝试了什么？什么是fasta文件？我不认为有太多的用户，所以谁的工

如何用Perl语言从fasta文件中读取DNA序列并将其存储在数组中，然后从每个核苷酸位置提取给定长度的所有子字符串？我的意思是我想读一个非常大的序列然后从每个核苷酸位置开始将其拆分成许多序列这意味着第一个序列从第一个核苷酸开始到第七十个核苷酸然后第二个序列从第二个核苷酸开始到第七十一个，依此类推。利用Bioperl的捆绑分布，我举了一个例子（如果这是你想要的）

请提供一些例子，你到底在寻找什么，并展示一些代码，到目前为止尝试了什么？什么是fasta文件？我不认为有太多的用户，所以谁的工作与核苷酸和DNA序列。然而，如果你提供更多的信息，而不需要了解DNA/核苷酸和“fasta”（无论是什么意思），很多perl黑客将能够回答你的问题。你搜索过吗？

#!/usr/bin/perl
use strict;
use warnings;
use Bio::SeqIO;

my $in  = Bio::SeqIO->new(-file   => "fasta.txt",
                          -format => 'Fasta');

while ( my $seq = $in->next_seq() ) {
    print "Sequence ", $seq->id, "\n";
    for my $i (1 .. length($seq->seq) - 10) {
        print $seq->subseq($i,$i+10), "\n";
    }
}


__END__
*** Contents of fasta.txt

>chr1
AACCCCCCCCTCCCCCCGCTTCTGGCCACAGCACTTAAACACATCTCTGC
CAAACCCCAAAAACAAAGAACCCTAACACCAGCCTAACCAGATTTCAAAT
TTTATCTTTAGGCGGTATGCACTTTTAACAAAAAANNNNNNNNNNNNNNN
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
GCCCATCCTACCCAGCACACACACACCGCTGCTAACCCCATACCCCGAAC
CAACCAAACCCCAAAGACACCCCCCACAGTTTATGTAGCTTACCTCNNNN
>chrM
GATCACAGGTCTATCACCCTATTAACCACTCACGGGAGCTCTCCATGCAT
TTGGTATTTTCGTCTGGGGGGTGTGCACGCGATAGCATTGCGAGACGCTG
GAGCCGGAGCACCCTATGTCGCAGTATCTGTCTTTGATTCCTGCCTCATT
CTATTATTTATCGCACCTACGTTCAATATTACAGGCGAACATACCTACTA
AAGTGTGTTAATTAATTAATGCTTGTAGGACATAATAATAACAATTGAAT
GTCTGCACAGCCGCTTTCCACACAGACATCATAACAAAANAATTTCCACC