R ddply聚合列名
我正在使用ddply来聚合数据,但还没有找到一种优雅的方法来为输出数据帧指定列名 目前我正在这样做:R ddply聚合列名,r,plyr,R,Plyr,我正在使用ddply来聚合数据,但还没有找到一种优雅的方法来为输出数据帧指定列名 目前我正在这样做: agg_data <- ddply(raw_data, .(id, date, classification), nrow) names(agg_data)[4] <- "no_entries" agg_data您可以使用summary: agg_data <- ddply(raw_data, .(id, date, classification), summarise, "
agg_data <- ddply(raw_data, .(id, date, classification), nrow)
names(agg_data)[4] <- "no_entries"
agg_data您可以使用summary
:
agg_data <- ddply(raw_data, .(id, date, classification), summarise, "no_entries" = nrow(piece))
或
编辑
或者正如Joshua所评论的,全大写版本,NROW
为您进行检查。我经常使用的通用形式是:
ddply(raw_data, .(id, date, classification), function(x) data.frame( no_entries=nrow(x) )
我几乎一直在我的ddply
语句中使用匿名函数,因此上面的习惯用法与匿名函数非常吻合。这不是表示函数(如nrow()
)的最简洁的方法,但对于传递多个参数的函数,我非常喜欢它 NROW
为您进行必要的检查。这很有效;我不知道片段
变量。当我已经使用colwise函数时,你知道它是如何工作的吗?我在上面的问题中添加了第二个例子。@behas-不确定你的确切意思;您的第二个示例可以通过…,summary,mean(无条目))
完成。或者您询问的是工件
变量?您可能还想查看计数
ddply(baseball, .(year), summarise, newColumn = nrow(piece))
ddply(baseball, .(year), summarise, newColumn = length(year))
ddply(raw_data, .(id, date, classification), function(x) data.frame( no_entries=nrow(x) )