R 映射每个组的变量摘要
我想在变量上使用R 映射每个组的变量摘要,r,dplyr,R,Dplyr,我想在变量上使用summary,用于我的TIBLE的每组。 我无法实现自动化,我找到的唯一方法是手工操作: diamonds %>% group_by(cut) %>% summarise( min = min(price), Q1 = quantile(price, 0.25), median = median(price), mean = mean(price), Q3 = quantile(price, 0.75),
summary
,用于我的TIBLE的每组。
我无法实现自动化,我找到的唯一方法是手工操作:
diamonds %>%
group_by(cut) %>%
summarise(
min = min(price),
Q1 = quantile(price, 0.25),
median = median(price),
mean = mean(price),
Q3 = quantile(price, 0.75),
max = max(price)
)
# cut min Q1 median mean Q3 max
# <ord> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# 1 Fair 337 2050. 3282 4359. 5206. 18574
# 2 Good 327 1145 3050. 3929. 5028 18788
# 3 Very Good 336 912 2648 3982. 5373. 18818
# 4 Premium 326 1046 3185 4584. 6296 18823
# 5 Ideal 326 878 1810 3458. 4678. 18806
钻石%>%
分组依据(切割)%>%
总结(
最小值=最小值(价格),
Q1=分位数(价格,0.25),
中位数=中位数(价格),
平均值=平均值(价格),
Q3=分位数(价格,0.75),
最大值=最大值(价格)
)
#切割最小Q1中值平均Q3最大值
#
#1公平337 2050。3282 4359. 520618574
#2良好327 1145 3050。39295028 18788
#3非常好336 912 2648 3982。537318818
#4保费326 1046 3185 4584。6296 18823
#5理想326 878 1810 3458。467818806
但是在summary
中写每一行都很无聊,我想为每个小组画一张summary
。我尝试了purr
,但似乎可以映射多个变量,但不能映射单个变量的多个组
感谢您的帮助,抱歉英语不好您可以在本案例中尝试以下方法:
diamonds %>%
group_by(cut) %>%
do(as.data.frame(as.list(summary(.$price))))
# A tibble: 5 x 7
# Groups: cut [5]
cut Min. X1st.Qu. Median Mean X3rd.Qu. Max.
<ord> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 Fair 337 2050. 3282 4359. 5206. 18574
2 Good 327 1145 3050. 3929. 5028 18788
3 Very Good 336 912 2648 3982. 5373. 18818
4 Premium 326 1046 3185 4584. 6296 18823
5 Ideal 326 878 1810 3458. 4678. 18806
钻石%>%
分组依据(切割)%>%
do(as.data.frame(as.list(摘要(.$price)))
#一个tibble:5x7
#分组:删去[5]
切割最小X1st.Qu。中位平均值x3.Qu。最大值。
1公平337 2050。3282 4359. 520618574
2良好327 1145 3050。39295028 18788
3非常好336 912 2648 3982。537318818
4保费326 1046 3185 4584。6296 18823
5理想326 878 1810 3458。467818806