r-dplyr:计算同一数据帧中另一个变量的每个唯一值在一个变量中唯一值的频率
下面是我的数据框中的一些行的示例:r-dplyr:计算同一数据帧中另一个变量的每个唯一值在一个变量中唯一值的频率,r,dplyr,R,Dplyr,下面是我的数据框中的一些行的示例: > data[1:25, c("TR_DATE", "TR_TYPE...")] TR_DATE TR_TYPE... 1 2016-03-01 4 2 2016-03-01 4 3 2016-03-01 5 4 2016-03-01 4 5 2016-03-01 1 6 2016-03-01 7 7 2016-03-01
> data[1:25, c("TR_DATE", "TR_TYPE...")]
TR_DATE TR_TYPE...
1 2016-03-01 4
2 2016-03-01 4
3 2016-03-01 5
4 2016-03-01 4
5 2016-03-01 1
6 2016-03-01 7
7 2016-03-01 4
8 2016-03-01 4
9 2016-03-01 24
10 2016-03-01 23
11 2016-03-01 4
12 2016-03-02 4
13 2016-03-02 1
14 2016-03-02 1
15 2016-03-02 4
16 2016-03-02 4
17 2016-03-02 14
18 2016-03-02 4
19 2016-03-02 4
20 2016-03-03 4
21 2016-03-03 1
22 2016-03-03 4
23 2016-03-03 23
24 2016-03-03 1
25 2016-03-03 4
我想做的就是以这样一种方式重新安排,对于每一个独特的日子,我得到独特交易类型的数量和每个交易类型的频率
以下是我尝试的代码:
data %>%
group_by(TR_DATE) %>%
summarise(trancount = n(), trantype = n_distinct(TR_TYPE...))
这让我得到了我想要的部分结果:
# A tibble: 68 x 3
TR_DATE trancount trantype
<date> <int> <int>
1 2016-03-01 5816 6
2 2016-03-02 5637 3
3 2016-03-03 4818 3
4 2016-03-04 5070 8
5 2016-03-05 4 2
6 2016-03-08 6707 5
7 2016-03-09 5228 5
8 2016-03-10 4722 6
9 2016-03-11 4469 8
10 2016-03-12 1 1
# ... with 58 more rows
trantype告诉我在某一天发生的独特交易类型的数量,但我想知道这些独特交易类型的频率。做这件事最好的方法是什么?
我试着四处看看,发现了类似的问题,但无法根据我的要求修改解决方案。
我是R的新手,非常感谢您的帮助。谢谢。您应该根据两个变量进行分组:
data %>%
group_by(TR_DATE, TR_TYPE...) %>%
summarise(trancount = n(), trantype = n_distinct(TR_TYPE...))
您是否尝试过按这两个变量分组?