Python 如何从fastq文件中删除SeqRecord对象

Python 如何从fastq文件中删除SeqRecord对象,python,parsing,biopython,fasta,fastq,Python,Parsing,Biopython,Fasta,Fastq,我有一个已解析的fastq文件,我正在对读取进行一些操作。具体地说,我试图确定我的fastq文件是否有属于微生物污染的读取,而不是我的人类样本。因此,如果我的读数是污染,我需要将其从fastq文件中删除,以便只读取属于人类样本的读数。 我试过这个 for record_seq in SeqIO.parse("file.fastq","fastq"): if condition==T: record_seq=""

我有一个已解析的fastq文件,我正在对读取进行一些操作。具体地说,我试图确定我的fastq文件是否有属于微生物污染的读取,而不是我的人类样本。因此,如果我的读数是污染,我需要将其从fastq文件中删除,以便只读取属于人类样本的读数。 我试过这个

for record_seq in SeqIO.parse("file.fastq","fastq"):
    if condition==T:
        record_seq=""


But with this code i wasnt deleting my record, cause i had the same records counts in the final file.
So i thinked about the method pop , but i can not use it due to it is only for lists, and record_seq is a SeqRecord object... any ideas? Thanks!
测试文件:

@seq1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq2
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq3
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
代码:

最终文件:

@seq1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq3
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
测试文件:

@seq1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq2
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq3
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
代码:

最终文件:

@seq1
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
@seq3
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

如果这是你想要的,试试这个。假设您有属于您的微生物的特定序列,请按如下所示列出,然后运行代码:

micro_organism_seqs=['seq1','seq2','seq3',...]

如果这是你想要的,试试这个。假设您有属于您的微生物的特定序列,请按如下所示列出,然后运行代码:

micro_organism_seqs=['seq1','seq2','seq3',...]