Genome 用Plink提取个体。错误:keep文件的第1行的令牌数比预期的少

Genome 用Plink提取个体。错误:keep文件的第1行的令牌数比预期的少,genome,Genome,我有1000个基因组项目中2504个个体的档案,我想按人口进行筛选。我为第一批人(ACB)做了以下工作: 但它返回了以下错误: Error: Line 1 of --keep file has fewer tokens than expected. plink --file allconcat39 --keep indACB2.txt --make-bed --out allconcat43ACB Error: No people remaining after --keep. 我的ind

我有1000个基因组项目中2504个个体的档案,我想按人口进行筛选。我为第一批人(ACB)做了以下工作:

但它返回了以下错误:

Error: Line 1 of --keep file has fewer tokens than expected.
plink --file allconcat39 --keep indACB2.txt --make-bed --out allconcat43ACB

Error: No people remaining after --keep.
我的indACB.txt文件如下所示:

head indACB.txt 
HG01879
HG01880
HG01882
HG01883
HG01885
HG01886
HG01889
HG01890
HG01894
HG01896
head indACB2.txt 
HG01879 HG01879 ACB
HG01880 HG01880 ACB
HG01882 HG01882 ACB
HG01883 HG01883 ACB
HG01885 HG01885 ACB
HG01886 HG01886 ACB
HG01889 HG01889 ACB
HG01890 HG01890 ACB
HG01894 HG01894 ACB
HG01896 HG01896 ACB
这是我从1000基因组页面中的人口信息文件中创建的(por每个人口,使用grep),该文件有两倍于个人ID(前两列)和一个人口名称,如图所示:

head indpop2.txt
HG00096 HG00096 GBR
HG00097 HG00097 GBR
HG00099 HG00099 GBR
HG00100 HG00100 GBR
HG00101 HG00101 GBR
HG00102 HG00102 GBR
HG00103 HG00103 GBR
HG00105 HG00105 GBR
HG00106 HG00106 GBR
HG00107 HG00107 GBR
我认为我的--keep文件有问题,但我不确定txt文件想要的结构是什么

我还尝试从indpop2.txt中对ACB个人进行灰显,因此新的indACB.txt文件如下所示:

head indACB.txt 
HG01879
HG01880
HG01882
HG01883
HG01885
HG01886
HG01889
HG01890
HG01894
HG01896
head indACB2.txt 
HG01879 HG01879 ACB
HG01880 HG01880 ACB
HG01882 HG01882 ACB
HG01883 HG01883 ACB
HG01885 HG01885 ACB
HG01886 HG01886 ACB
HG01889 HG01889 ACB
HG01890 HG01890 ACB
HG01894 HG01894 ACB
HG01896 HG01896 ACB
但它会产生以下错误:

Error: Line 1 of --keep file has fewer tokens than expected.
plink --file allconcat39 --keep indACB2.txt --make-bed --out allconcat43ACB

Error: No people remaining after --keep.

前两列是族ID和单个ID;第三列应为数值(尽管文件可以有3列以上),并且只有值为1的个人才会包含在任何后续分析或文件生成过程中