R 添加来自两个不同组的相同观察结果。普利尔还是塔普利?
希望创建一个函数 我想把一个观察在给定的组中出现的次数加起来(例如5次,5次,2次)。将业务部门在周内的天数相加。合计值将出现在新行“总发生次数”中 tapply或plyr在这方面发挥了作用,但我仍停留在一些细微差别上 谢谢R 添加来自两个不同组的相同观察结果。普利尔还是塔普利?,r,function,sum,plyr,tapply,R,Function,Sum,Plyr,Tapply,希望创建一个函数 我想把一个观察在给定的组中出现的次数加起来(例如5次,5次,2次)。将业务部门在周内的天数相加。合计值将出现在新行“总发生次数”中 tapply或plyr在这方面发挥了作用,但我仍停留在一些细微差别上 谢谢 14X3 matrix Business Week Days A **1** 3 A **1** 3 A **1**
14X3 matrix
Business Week Days
A **1** 3
A **1** 3
A **1** 1
A 2 4
A 2 1
A 2 1
A 2 6
A 2 1
B **1** 1
B **1** 2
B **1** 7
B 2 2
B 2 2
B 2 na
**AND BECOME**
10X4 matrix
Business Week Days Total-Occurrences
A **1** 3 2
A **1** 1 1
A 2 1 3
A 2 4 1
A 2 6 1
B **1** 1 1
B **1** 2 1
B **1** 7 1
B 3 2 2
B 2 na 0
如果我正确理解您的问题,您希望按
业务
和周
和天
对数据框进行分组,并在新列中计算每组的发生次数总发生次数
df <- structure(list(Business = structure(c(1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("A", "B"), class = "factor"),
Week = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 1L, 1L,
1L, 2L, 2L, 2L), .Label = c("**1**", "2"), class = "factor"),
Days = structure(c(3L, 3L, 1L, 4L, 1L, 1L, 5L, 1L, 1L, 2L,
6L, 2L, 2L, 7L), .Label = c("1", "2", "3", "4", "6", "7",
"na"), class = "factor")), .Names = c("Business", "Week",
"Days"), class = "data.frame", row.names = c(NA, -14L))
您也可以使用plyr
:
require(dplyr)
result <- df %.%
group_by(Business,Week,Days) %.%
summarize(Total.Occurences = n())
#>result
# Business Week Days Total.Occurences
#1 A **1** 1 1
#2 A **1** 3 2
#3 A 2 1 3
#4 A 2 4 1
#5 A 2 6 1
#6 B **1** 1 1
#7 B **1** 2 1
#8 B **1** 7 1
#9 B 2 2 2
#10 B 2 na 1
require(plyr)
ddply(df, .(Business, Week, Days), nrow)
请注意,基于这些函数,输出将与您在问题中发布的略有不同。我认为这可能是一个输入错误,因为在您的原始数据中没有第3周,但在您想要的输出中有
在这两种解决方案之间,dplyr
方法可能更快
我想还有其他方法可以做到这一点(但我不确定tapply)你的问题是什么?抱歉,这是为了创建一个函数来创建一个新行“总发生次数”。我想将每个给定的业务和周相同“天”的总发生次数相加。