在BASH中连接多组2个fastq文件

在BASH中连接多组2个fastq文件,bash,for-loop,bioinformatics,cat,fastq,Bash,For Loop,Bioinformatics,Cat,Fastq,我正在尝试合并来自同一序列库的多组2个fastq文件。我有一个包含所有样本名称的txt文件。样本以成对末端排序,因此每个样本都有_1.fastq.gz和_2.fastq.gz文件 SRR_Acc_list.txt SRR1 SRR2 SRR3 SRR4 下面的代码是我试图实现的:将读取1和读取2的SRR1和SRR2合并到输出文件夹combined\u fastq中的一个fastq文件中 cat SRA/SRR1_1.fastq.gz SRA/SRR2_1.fastq.gz > combi

我正在尝试合并来自同一序列库的多组2个fastq文件。我有一个包含所有样本名称的txt文件。样本以成对末端排序,因此每个样本都有_1.fastq.gz和_2.fastq.gz文件

SRR_Acc_list.txt
SRR1
SRR2
SRR3
SRR4

下面的代码是我试图实现的:将读取1和读取2的SRR1和SRR2合并到输出文件夹combined\u fastq中的一个fastq文件中

cat SRA/SRR1_1.fastq.gz SRA/SRR2_1.fastq.gz > combined_fastq/SRR1_1.fastq.gz

cat SRA/SRR1_2.fastq.gz SRA/SRR2_2.fastq.gz > combined_fastq/SRR1_2.fastq.gz

我很难弄清楚如何对其余的样品进行处理。例如,将SRR3和SRR4、SRR5和SRR6等组合成一个循环。

与StackOverflow上的大多数人一样,我对生物信息学、fastq或“成对末端”一无所知,但我可以复制您似乎想要的模式:

xargs -n2 < SRR_Acc_list.txt |
   while read a b ; do
      for c in 1 2 ; do
         echo $a, $b, $c
      done
   done

非常感谢你,这真是太棒了!很高兴它对你有用。如果您只需单独运行
xargs-n2
,您就有希望了解它的工作原理。祝你的项目好运!
SRR1, SRR2, 1
SRR1, SRR2, 2
SRR3, SRR4, 1
SRR3, SRR4, 2