Vcf variant call format 如何使用列表CHR或重叠ID筛选VCF文件?

Vcf variant call format 如何使用列表CHR或重叠ID筛选VCF文件?,vcf-variant-call-format,vcftools,Vcf Variant Call Format,Vcftools,我需要通过CHR列中显示的一长串非顺序重叠ID来子集/过滤SNP vcf文件。我的VCF文件目前包含13971个重叠群,我想保留一组特定的7748个重叠群以及与这些重叠群相关的所有信息(所有变体和基因型信息等) 我的挫伤列表如下所示: dDocent_Contig_1 dDocent_Contig_100 dDocent_Contig_10000等 我正在考虑以下脚本: vcftools--vcf TotalRawSNPs.vcf--chr dDocent_Contig_1--chr dDoce

我需要通过CHR列中显示的一长串非顺序重叠ID来子集/过滤SNP vcf文件。我的VCF文件目前包含13971个重叠群,我想保留一组特定的7748个重叠群以及与这些重叠群相关的所有信息(所有变体和基因型信息等)

我的挫伤列表如下所示:

dDocent_Contig_1

dDocent_Contig_100

dDocent_Contig_10000等

我正在考虑以下脚本:
vcftools--vcf TotalRawSNPs.vcf--chr dDocent_Contig_1--chr dDocent_Contig_100(等)--recode--recode INFO all--out FinalRawSNPs

在这里,我用--chr标志分别列出了每个contig ID。对于这个--chr标志,我不能向它提供一个要保留的contig id文本文件,这将是理想的。如果我单独列出所有contig,它将在命令行中创建一个大型脚本


我看到过按个人列表过滤的选项,但没有任何仅按CHR/contig ID过滤的明确选项。有没有更有效的方法通过CHR/contig过滤我的vcf文件?

你找到过解决方法吗?我正在尝试做类似的事情——从VCF中删除许多特定的contigs/Chrom。谢谢。嗨,我在另一个网站上找到了帮助。请参阅此链接了解编码及其对我的影响:我发现此解决方案有点笨重。然而,这对我当时的经验水平非常有效。另一个您可以自定义的代码是remove.bad.hap.locies.sh脚本:您找到解决方案了吗?我正在尝试做类似的事情——从VCF中删除许多特定的contigs/Chrom。谢谢。嗨,我在另一个网站上找到了帮助。请参阅此链接了解编码及其对我的影响:我发现此解决方案有点笨重。然而,这对我当时的经验水平非常有效。您可以根据自己的需要自定义的另一段代码是remove.bad.hap.locis.sh脚本,该脚本位于以下位置: