Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/352.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何处理解压hs37d5 fastq文件时产生的尾随垃圾_Java_Gzip_Picard - Fatal编程技术网

Java 如何处理解压hs37d5 fastq文件时产生的尾随垃圾

Java 如何处理解压hs37d5 fastq文件时产生的尾随垃圾,java,gzip,picard,Java,Gzip,Picard,我真的试图解决这个问题,但似乎以前没有人遇到过这个问题。我从1000G解压了fastq文件: gunzip -c **hs37d5.fa.gz** | awk '{if(NR%4==1) {printf(">%s\n",substr($0,2));} else if(NR%4==2) print;}' > ref.fa 不过,解压缩的文件夹有一些“尾随垃圾”,它会导致以下错误: 线程“main”picard.PicardException中出现异常:序列名称在引用中出现多次 尝试运

我真的试图解决这个问题,但似乎以前没有人遇到过这个问题。我从1000G解压了fastq文件:

gunzip -c **hs37d5.fa.gz** | awk '{if(NR%4==1) {printf(">%s\n",substr($0,2));} else if(NR%4==2) print;}' > ref.fa
不过,解压缩的文件夹有一些“尾随垃圾”,它会导致以下错误:

线程“main”picard.PicardException中出现异常:序列名称在引用中出现多次

尝试运行时:

java -jar picard.jar CreateSequenceDictionary R=ref.fasta O=ref.dict

如果有人能给我一点帮助,我将不胜感激

您正在提取fasta文件,但正在使用将用于fastq文件的
NR%4
。感谢您的回复。如果我使用gunzip-ct hs37d5.fa.gz>tmp.fa来测试fasta文件,它会为我提供一个空输出。要获得任何有用的帮助,请创建一个最小的可验证示例