Python 随机选择fasta文件中的行子集

Python 随机选择fasta文件中的行子集,python,bioinformatics,Python,Bioinformatics,我有一个大约1800万次读取的fasta文件。我将它的开头引入Python,并使用forloop w/if/else语句构建了一个字典,其中key=readID和value=sequence 现在,我想从原始文件中随机选择10000次读取的子集。我认为另一个for循环是必要的,但我不确定从哪里开始 提前感谢当您使用FASTQfiles时,您应该真正使用它。它支持读取FASTQ文件并将其转换为字典,无需for循环 来自Bio导入序列 随机输入 record_dict=SeqIO.to_dict(S

我有一个大约1800万次读取的fasta文件。我将它的开头引入Python,并使用forloop w/if/else语句构建了一个字典,其中key=readID和value=sequence

现在,我想从原始文件中随机选择10000次读取的子集。我认为另一个for循环是必要的,但我不确定从哪里开始


提前感谢

当您使用FASTQfiles时,您应该真正使用它。它支持读取FASTQ文件并将其转换为字典,无需for循环

来自Bio导入序列
随机输入
record_dict=SeqIO.to_dict(SeqIO.parse(“example.fastq”,“fastq”))
random_reads=random.sample(记录_dict.items(),10000)
对于readID,随机_中的序列读取:
打印(readID,序列)

您有fasta或fastq文件吗?您能展示一些示例数据和您已经开发的代码吗?