R 统计唯一变量的出现次数
我有一个变量的数据框架,有些变量不止一次出现,例如: a、 b,b,b,c,c,d,e,f 然后,我希望得到如下输出(在两列中): a 1;b3;C2;d1;e1;f1。R 统计唯一变量的出现次数,r,count,statistics,R,Count,Statistics,我有一个变量的数据框架,有些变量不止一次出现,例如: a、 b,b,b,c,c,d,e,f 然后,我希望得到如下输出(在两列中): a 1;b3;C2;d1;e1;f1。 额外问题:如果变量在计数列中出现的次数少于“n”次,我希望将变量命名为某个名称(例如,如果出现次数少于2次,则命名为“其他”。制表和折叠 你的例子向量是 vec <- letters[c(1,2,2,2,3,3,4,5,6)] vec使用as.data.frame(表(您的向量))。如果a,b,c是重复的列名。将you
额外问题:如果变量在计数列中出现的次数少于“n”次,我希望将变量命名为某个名称(例如,如果出现次数少于2次,则命名为“其他”。制表和折叠 你的例子向量是
vec <- letters[c(1,2,2,2,3,3,4,5,6)]
vec使用as.data.frame(表(您的向量))
。如果a
,b
,c
是重复的列名。将yourvector
替换为colnames(yourdata)
奖励提示:请提供一个可复制的示例。@RichardScribe即使在可复制性方面,对我来说,这并不比我见过的其他情况更糟,比如粘贴csv的某些行或R控制台打印的结果。@每个人:奖金问题并不是我所知道的一个骗局(?),所以仅仅因为缺少格式而否决票似乎有点苛刻。@akrun谢谢你指出这一点;我错过了。我添加了一些基本的R选项,让我觉得更简单。
tab <- table(vec)
res <- c(tab[tab>=2],other=sum(tab[tab<2]))
# b c other
# 3 2 4
resdf <- data.frame(count=res)
# count
# b 3
# c 2
# other 4