dplyr样式计数(如果按r中的组)

dplyr样式计数(如果按r中的组),r,R,e、 g 错误:summary()inputpct\u price\u高于\u 350时出现问题。 没有适用于“逻辑”类对象的“组变量”的方法 ℹ 在350上方输入的pct\u价格是(count(price>351)/n())。 ℹ 错误发生在组1中:cut=“Fair” 上述区块的目标是返回每个组中价格高于350的百分比。我怎么能这么做?首选tidyverse/dplyr,但我会尽我所能。count需要一个data.frame或tibble作为输入。我们可以使用sum diamonds %&g

e、 g

错误:
summary()
input
pct\u price\u高于\u 350
时出现问题。 没有适用于“逻辑”类对象的“组变量”的方法 ℹ 在350上方输入的
pct\u价格
(count(price>351)/n())
。 ℹ 错误发生在组1中:cut=“Fair”


上述区块的目标是返回每个组中价格高于350的百分比。我怎么能这么做?首选tidyverse/dplyr,但我会尽我所能。

count
需要一个data.frame或tibble作为输入。我们可以使用
sum

diamonds %>% 
  group_by(cut) %>% 
  summarise(pct_price_above_350 = (count(price > 350) / n()))
平均值

library(dplyr)
library(ggplot2)
data(diamonds)
diamonds %>% 
  group_by(cut) %>% 
  summarise(pct_price_above_350 = (sum(price > 350) / n()), .groups = 'drop')

太好了,谢谢。在时限到期时接受。另外,在新版本中,.groups=drop-doing是什么?@DougFir,如果我们没有指定,那么将有一个默认选项,只删除最后一个分组变量(如果有多个)。在这里,它将删除剪切组,在输出中,您将有``summary()`解组输出(用
.groups
参数覆盖)`为了避免该通知,我使用了一个事实,即它将确保不会有任何组(如果有多个组)
diamonds %>% 
 group_by(cut) %>% 
 summarise(pct_price_above_350 = (mean(price > 350) ), .groups = 'drop')