Bash 使用bowtie2为循环(for循环)应用文件限制

Bash 使用bowtie2为循环(for循环)应用文件限制,bash,for-loop,alignment,samtools,Bash,For Loop,Alignment,Samtools,您好,我只想对一组文件应用一个循环,但不是对所有文件应用循环,而是只对目录中的某些文件进行循环 这是我使用的命令,是基于bowtie2的基因组序列比对: for i in *1.fastq.gz do base=$(basename $i "_1.fastq.gz") bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools vi

您好,我只想对一组文件应用一个循环,但不是对所有文件应用循环,而是只对目录中的某些文件进行循环

这是我使用的命令,是基于bowtie2的基因组序列比对:

 for i in *1.fastq.gz
    do 
    base=$(basename $i "_1.fastq.gz")
    bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools view -b -o ${base}.bam -
    done

因此,使用此命令,bowtie2将与我的所有文件对齐,但鉴于此文件夹中有一些文件的bowtie2分析已完成,我不希望bowtie2再次对这些文件进行分析,因此,是否有任何子命令可以添加到此循环中以避免分析某些文件?

创建2个文件,每行1个基本名称:(1)您的输入,此处读取1个fastq基本文件名;(2)您的现有输出,此处为bam基本文件名。对文件进行排序,并使用
comm-23 file1 file2>file3
仅选择尚未映射的基本名称。然后循环这些,保存在
文件3

快速脏的解决方案(假定文件名没有空格):

ls-1*_1.fastq.gz|perl-pe's/_1.fastq.gz/'| sort>in.basenames.txt
ls-1*.bam | perl-pe's/.bam/'| sort>out.basenames.txt
comm-23 in.basenames.txt out.basenames.txt>todo.in.basenames.txt
当读取-r base_name时;做
bowtie2-1${base\u name}u 1.fastq.gz-2${base\u name}u 2.fastq.gz。。。
完成
创建2个文件,每行1个基本名称:(1)您的输入,此处读取1个fastq基本文件名,(2)您的现有输出,此处读取bam基本文件名。对文件进行排序,并使用
comm-23 file1 file2>file3
仅选择尚未映射的基本名称。然后循环这些,保存在
文件3

快速脏的解决方案(假定文件名没有空格):

ls-1*_1.fastq.gz|perl-pe's/_1.fastq.gz/'| sort>in.basenames.txt
ls-1*.bam | perl-pe's/.bam/'| sort>out.basenames.txt
comm-23 in.basenames.txt out.basenames.txt>todo.in.basenames.txt
当读取-r base_name时;做
bowtie2-1${base\u name}u 1.fastq.gz-2${base\u name}u 2.fastq.gz。。。
完成
以后,请修复您的进程,以便将处理过的文件移动到其他目录。您没有指定要跳过的文件的任何内容。您是否可以重命名为
*1a.fastq.gq
(例如),这样它们就不会被处理。否则,您必须在循环中测试名称,但这将很棘手。最好批量移动或重命名文件,使其与
*1.fastq.gz
不匹配。(如果您可以创建一个包含应排除的问题列表的文件,然后使用一个小样本更新您的问题,我们可能会提供帮助)。祝你好运。你想运行多少个fastq文件?如果没有太多,您可以为for循环指定它们中的每一个,例如R001.fastq.gz R002.fastq.gz R003.fastq.gzetc中的i。将来,请修复您的进程,以便将处理过的文件移动到不同的目录。您没有指定要跳过的文件的任何内容。您是否可以重命名为
*1a.fastq.gq
(例如),这样它们就不会被处理。否则,您必须在循环中测试名称,但这将很棘手。最好批量移动或重命名文件,使其与
*1.fastq.gz
不匹配。(如果您可以创建一个包含应排除的问题列表的文件,然后使用一个小样本更新您的问题,我们可能会提供帮助)。祝你好运。你想运行多少个fastq文件?如果没有很多,您可以为for循环指定它们中的每一个,例如在R001.fastq.gz R002.fastq.gz R003.fastq.gz中为i指定

ls -1 *_1.fastq.gz | perl -pe 's/_1.fastq.gz//' | sort > in.basenames.txt
ls -1 *.bam | perl -pe 's/.bam//' | sort > out.basenames.txt
comm -23 in.basenames.txt out.basenames.txt > todo.in.basenames.txt

while read -r base_name ; do
    bowtie2 -1 ${base_name}_1.fastq.gz -2 ${base_name}_2.fastq.gz ...
done < todo.in.basenames.txt