对具有相等值的列进行r筛选
假设我有一个这样的数据集对具有相等值的列进行r筛选,r,filter,R,Filter,假设我有一个这样的数据集 `v6 v7 v8 v9 x 123 123 x x 123 456 x x 789 789 x x 123 789 x ` 如何进行筛选,以便仅拉出第7列和第8列的值彼此相等的行,,同时仍保留筛选后列的标题?我尝试过以下代码: hg19->hg19[其中(hg19$V7==hg19$V8),] 该代码: non_coding= subset(hg19,hg19[8] == hg19[7]) 其中hg19是数据集注意:实际数据集有
`v6 v7 v8 v9
x 123 123 x
x 123 456 x
x 789 789 x
x 123 789 x `
如何进行筛选,以便仅拉出第7列和第8列的值彼此相等的行,,同时仍保留筛选后列的标题?我尝试过以下代码:
hg19->hg19[其中(hg19$V7==hg19$V8),]
该代码:
non_coding= subset(hg19,hg19[8] == hg19[7])
其中hg19是数据集注意:实际数据集有超过99000行和16列提供给您的代码工作正常,并保留原始列名
hg19[which(hg19$v7==hg19$v8),]
v6 v7 v8 v9
1 x 123 123 x
3 x 789 789 x
非编码与列名匹配<代码>hg19[hg19$v7==hg19$v8,]
。您使用的是V7
和V8
而不是V7
和V8
。在第二个代码中,它将示例中不存在的8th
和7th
列子集化(因为它只有4列数据集。我编辑了原始文章,但实际数据集有99000多行和16列。这两个代码都按照我的要求执行,但它们没有保留列标题,这将使数据很难处理。为什么赋值箭头指向右侧?此外,示例列名的大小写为v,但测试是使用大写V进行的。R是区分大小写的。您的确切意思是“过滤后仍保留列的标题”?您能用您的示例给出预期结果吗?根据目前提供的解决方案,似乎在过滤v6和v8后保留了。您需要什么?
non_coding <- subset(hg19, hg19$v7 == hg19$v8)