基于频率的dplyr链式滤波器_R_Dplyr

基于频率的dplyr链式滤波器

基于频率的dplyr链式滤波器,r,dplyr,R,Dplyr,假设我想过滤低频项，在本例中小于10。有没有一种优雅的dplyr风格的方法可以做到这一点 table(mtcars$cyl) 4 6 8 11 7 14 结果将是一个只有4和8个cyl的数据帧，因为它们都出现10次或更多次。按cyl分组，计算行数，过滤，可选地删除freq列： mtcars %>% group_by(cyl) %>% filter([???]) 谢谢，ungroup（）的作用是什么？它通过cyl删除分组。通常情况下，最好在程序完成后取消分组，因为将其

假设我想过滤低频项，在本例中小于10。有没有一种优雅的dplyr风格的方法可以做到这一点

table(mtcars$cyl)

 4  6  8 
11  7 14

结果将是一个只有4和8个cyl的数据帧，因为它们都出现10次或更多次。

按

cyl

分组，计算行数，过滤，可选地删除

freq

列：

mtcars %>% group_by(cyl) %>% filter([???])

谢谢，ungroup（）的作用是什么？它通过

cyl

删除分组。通常情况下，最好在程序完成后取消分组，因为将其留在那里可能会产生意外的后果。为什么不按（cyl）%%>%group_按（cyl）%%>%filter（n（）>9）？为什么不：）我更喜欢显式变量可能的重复，还有这里的协议是什么？我会删除，因为人们投反对票，但问题已经得到回答，所以这对那个人不公平。另外，当我第一次尝试解决这个问题时，我用关键词“frequency”进行了谷歌搜索，但没有返回上面的任何答案，所以谁知道呢，也许这个问题会帮助搜索使用这个词的人

library(dplyr)
mtcars %>% 
  group_by(cyl) %>% 
  mutate(freq = n()) %>% 
  ungroup() %>% 
  filter(freq > 9) %>%
  select(-freq)