Java 使用SnpSift,只有0.52%的VCF被dbsnp数据库注释

Java 使用SnpSift,只有0.52%的VCF被dbsnp数据库注释,java,bioinformatics,bcftools,vcf-variant-call-format,Java,Bioinformatics,Bcftools,Vcf Variant Call Format,我使用以下命令从cram生成了一个坐标排序的vcf文件: samtools sort-@10-o/output/sorted.cram samtools索引-@10/output/sorted.cram bcftools mpileup-f reference.fa-r chrz:zzzzzzzzx-a INFO/AD,FORMAT/DP-threads 10-O v-O/output/mpileup.vcf/input/sorted.cram 我试图用snpsift注释坐标排序的vcf文件(参

我使用以下命令从cram生成了一个坐标排序的vcf文件:

samtools sort-@10-o/output/sorted.cram

samtools索引-@10/output/sorted.cram

bcftools mpileup-f reference.fa-r chrz:zzzzzzzzx-a INFO/AD,FORMAT/DP-threads 10-O v-O/output/mpileup.vcf/input/sorted.cram

我试图用snpsift注释坐标排序的vcf文件(参考基因组Hg38)。我正在使用以下命令:

java-jar SnpSift.jar annotate-v/dbsnp/file.vcf.gz/input/mpileup.vcf>/output/annotated.vcf

我已在此处下载了dbsnp vcf文件和选项卡索引:

然而,只有0.52%的vcf被注释。。。这似乎很奇怪。此外,当我尝试使用集成web界面()来注释我的vcf时,我得到了错误“invalid input”。这让我相信我的vcf文件有问题?我只是试着注释一个基因,dbsnp只注释0.52%的基因是正常的吗?提前感谢您的帮助



更新!如果使用bcftools mpileup | bcftools仅调用--variants,则ensembl工具可以工作。此外,这人为地增加了注释的SNPs的百分比

我没有在你的图像上看到任何错误。上面写着:
错误(错误引用):0
@UsagiMiyamoto感谢您的回复!我认为“错误(错误引用)”是一条错误消息,但事实并非如此。我仍然担心只有0.52%的vcf被dbsnp注释。我已经澄清了上面的帖子。欢迎进一步评论!我没有在你的图像上看到任何错误。上面写着:
错误(错误引用):0
@UsagiMiyamoto感谢您的回复!我认为“错误(错误引用)”是一条错误消息,但事实并非如此。我仍然担心只有0.52%的vcf被dbsnp注释。我已经澄清了上面的帖子。欢迎进一步评论!