使用R中的多个列求和出现次数
我试图查看在特定日期收到特定错误消息的帐户总数的表结果。但是,一个帐户在任何一天都可能收到数百条不同的错误消息。例如,此表称为ERROR,我的列为:使用R中的多个列求和出现次数,r,multiple-columns,R,Multiple Columns,我试图查看在特定日期收到特定错误消息的帐户总数的表结果。但是,一个帐户在任何一天都可能收到数百条不同的错误消息。例如,此表称为ERROR,我的列为: date error acct# freq 2016-04-20 panda 2 1 2016-04-20 pig 2 1 2016-04-20 panda 3 1 2016-04-20
date error acct# freq
2016-04-20 panda 2 1
2016-04-20 pig 2 1
2016-04-20 panda 3 1
2016-04-20 panda 7 1
2016-04-25 panda 4 1
2016-04-27 bird 4 1
2016-04-27 bird 3 1
这是我的密码:
Error_Freq = ddply(ERROR, .(date), summarize, freq=sum(freq))
View(Error_Freq)
但这只给了我每天的账户总数。
我希望输出看起来像:
date error freq
2016-04-20 panda 3
2016-04-20 pig 1
2016-04-25 panda 1
2016-04-27 bird 2
有没有其他方法可以考虑这个问题?我们需要将
error
也用作分组变量
library(dplyr)
df1 %>%
group_by(date, error) %>%
summarise(freq = sum(freq))
date error freq
# <chr> <chr> <int>
#1 2016-04-20 panda 3
#2 2016-04-20 pig 1
#3 2016-04-25 panda 1
#4 2016-04-27 bird 2
library(plyr)
ddply(df1, .(date, error), summarize, freq=sum(freq))