基于频率的dplyr链式滤波器

基于频率的dplyr链式滤波器,r,dplyr,R,Dplyr,假设我想过滤低频项,在本例中小于10。有没有一种优雅的dplyr风格的方法可以做到这一点 table(mtcars$cyl) 4 6 8 11 7 14 结果将是一个只有4和8个cyl的数据帧,因为它们都出现10次或更多次。按cyl分组,计算行数,过滤,可选地删除freq列: mtcars %>% group_by(cyl) %>% filter([???]) 谢谢,ungroup()的作用是什么?它通过cyl删除分组。通常情况下,最好在程序完成后取消分组,因为将其

假设我想过滤低频项,在本例中小于10。有没有一种优雅的dplyr风格的方法可以做到这一点

table(mtcars$cyl)

 4  6  8 
11  7 14 

结果将是一个只有4和8个cyl的数据帧,因为它们都出现10次或更多次。

cyl
分组,计算行数,过滤,可选地删除
freq
列:

mtcars %>% group_by(cyl) %>% filter([???])

谢谢,ungroup()的作用是什么?它通过
cyl
删除分组。通常情况下,最好在程序完成后取消分组,因为将其留在那里可能会产生意外的后果。为什么不按(cyl)%%>%group_按(cyl)%%>%filter(n()>9)?为什么不:)我更喜欢显式变量可能的重复,还有这里的协议是什么?我会删除,因为人们投反对票,但问题已经得到回答,所以这对那个人不公平。另外,当我第一次尝试解决这个问题时,我用关键词“frequency”进行了谷歌搜索,但没有返回上面的任何答案,所以谁知道呢,也许这个问题会帮助搜索使用这个词的人
library(dplyr)
mtcars %>% 
  group_by(cyl) %>% 
  mutate(freq = n()) %>% 
  ungroup() %>% 
  filter(freq > 9) %>%
  select(-freq)