R 按“拆分数据”;栏「;具有聚合条件

R 按“拆分数据”;栏「;具有聚合条件,r,dataframe,R,Dataframe,考虑以下data.frame: > head(dtrain) content_id item_age item_ctr likes clicks no_clicks event 1 11201926 461540 0.02787456 1 24 837 0 2 11201926 462497 0.02784223 1 24 838 0 3 11201926 473215 0.027809

考虑以下data.frame:

> head(dtrain)
  content_id item_age   item_ctr likes clicks no_clicks event
1   11201926   461540 0.02787456     1     24       837     0
2   11201926   462497 0.02784223     1     24       838     0
3   11201926   473215 0.02780997     1     24       839     0
4   11201926   532983 0.02777778     1     24       840     0
5   11201926   536696 0.02774566     1     24       841     0
6   11201926   545545 0.02771363     1     24       842     0
我想按content_id分割数据,这只需要以下命令

result <- split(dtrain , f = dtrain$content_id )

result您可以首先使用
dplyr
筛选数据帧,以仅保留包含1000条或更多记录的内容组:

temp <- dtrain
    %>% group_by(content_id)
    %>% filter(n() >= 1000)
temp%分组人(内容id)
%>%过滤器(n()>=1000)
然后继续你原来的样子:

result <- split(temp, f=temp$content_id)

result感谢您优雅的解决方案!