根据dplyr中另一个字段的值汇总字段
我有一个数据帧DF,它有四个字段:根据dplyr中另一个字段的值汇总字段,r,dplyr,R,Dplyr,我有一个数据帧DF,它有四个字段:id、日期、特征、值。我想生成一个数据帧DF2,它有三个字段:id、feature、value,其中value是对应的id的值,而feature是最新可用的日期的值。用plyr的话说: DF2 <- ddply(DF, .(id, feature), function(x) c(value(x$value[x$date == max(x$date)])) DF2这只是对dplyr中plyr调用的直接翻译: library(dplyr) DF2 = sum
id、日期、特征、值。我想生成一个数据帧DF2,它有三个字段:id、feature、value
,其中value
是对应的id
的值,而feature
是最新可用的日期的值。用plyr的话说:
DF2 <- ddply(DF, .(id, feature), function(x) c(value(x$value[x$date == max(x$date)]))
DF2这只是对dplyr中plyr调用的直接翻译:
library(dplyr)
DF2 = summarise(group_by(DF, id, feature), value=value[which(date == max(date))])
一个可复制的数据集和期望的输出将保证你在5分钟内得到3个答案。谢谢,这是一个魅力。只需稍作修改,因为最近的日期可能有多条记录。很酷,我已经更新了我的答案以考虑到这一点