如何筛选列中条目数超过n的data.frame
如何从数据集中删除包含n个以上基因的行如何筛选列中条目数超过n的data.frame,r,R,如何从数据集中删除包含n个以上基因的行 data1 <- Re_leve logp chr start end CNA Genes 1 1.5 1 739400 756200 gain Trp1,Eggier 1 8.3 1 127730 128210 gain Zranb3,R3hdm1,..... data1您可以尝试 library(stringr) n
data1 <- Re_leve logp chr start end CNA Genes
1 1.5 1 739400 756200 gain Trp1,Eggier
1 8.3 1 127730 128210 gain Zranb3,R3hdm1,.....
data1您可以尝试
library(stringr)
n <- 1
df1[!str_count(df1$Genes, ',')+1 >n,]
库(stringr)
n,]
您可以试试
library(stringr)
n <- 1
df1[!str_count(df1$Genes, ',')+1 >n,]
库(stringr)
n,]
试试这个:
#dummy data
data1 <- data.frame(x=1:3,
Gene=c("asdf,asdf,ee,d","asdf","dfd,sdf"),
stringsAsFactors = FALSE)
#minimum number of genes
n <- 1
#subset
data1[sapply(data1$Gene,function(i)length(unlist(strsplit(i,",")))) > n, ]
# x Gene
# 1 1 asdf,asdf,ee,d
# 3 3 dfd,sdf
#虚拟数据
数据1试试这个:
#dummy data
data1 <- data.frame(x=1:3,
Gene=c("asdf,asdf,ee,d","asdf","dfd,sdf"),
stringsAsFactors = FALSE)
#minimum number of genes
n <- 1
#subset
data1[sapply(data1$Gene,function(i)length(unlist(strsplit(i,",")))) > n, ]
# x Gene
# 1 1 asdf,asdf,ee,d
# 3 3 dfd,sdf
#虚拟数据
data1@初学者你能说得更具体一点吗?@初学者你不再问同样的问题了吗@初学者:您是否尝试过链接中的解决方案。另外,这个问题和描述与您的后续问题完全不同。这里我想删除同一数据集中的重叠,而不是比较。我可以将其作为不同的数据发布question@beginner你能说得更具体一点吗?@初学者,你不是又问同样的问题了吗@初学者:您是否尝试过链接中的解决方案。另外,这个问题和描述与您的后续问题完全不同。这里我想删除同一数据集中的重叠,而不是比较。我可以将其作为不同的问题发布