R 如何在已生成计数的可变级别内计算描述性统计？_R

R 如何在已生成计数的可变级别内计算描述性统计？

R 如何在已生成计数的可变级别内计算描述性统计？,r,R,我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量（基线、经验和总体参与度），并计算了每个变量的样本量。下面是使用此代码的一个示例： Engagement <- Users %>% group_by(Engagement_overall)%>% summarise(engagement_count=n()) Engagement% 分组依据（参与度总体）%>% 总结（参与人数=n（）我试图计算平均年龄、女性百分比、该省百分比（安

我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量（基线、经验和总体参与度），并计算了每个变量的样本量。下面是使用此代码的一个示例：

Engagement <- 
    Users %>%
    group_by(Engagement_overall)%>%
    summarise(engagement_count=n())

Engagement%
分组依据（参与度总体）%>%
总结（参与人数=n（）

我试图计算平均年龄、女性百分比、该省百分比（安大略省、不列颠哥伦比亚省和纽芬兰拉布拉多省）、个人收入中位数以及各参与度水平（包括基线和经验的其他变量）内每天的基线平均步数。除基线每日平均步数外，上述所有变量均包含在主数据框中。用户：

我如何编写一个代码，将指标（平均年龄、女性百分比、省份百分比、个人收入中位数和每天基线平均步数）包含在每个参与度水平中？基线和经验也有4个级别。感谢您提供的帮助。

一种方法是分别制作表，然后将所有表连接起来。例如，我随机生成了一些数据：

库（tidyverse）
如果你还有年龄、性别等栏。。在Users
数据框中，您应该能够不断向summary
命令添加列，并用逗号分隔。示例：总结（订婚人数=n（），平均年龄=mean（年龄），…）非常感谢。有几个错误我希望你能帮我解决。我将在下面的回答中详细说明，因为用户的字符计数限制伴随着：income_level=sample（c（'province=sample（c（'ON'，'BC'，'NL'），584760，replace=T），错误：意外的，'in“province=sample（c（'ON'，'BC NL'），584760，replace=T），”>基线=样本（c（‘低’、‘中’、‘高’、‘NA’），584760，替换=T），错误：意外“，‘在’基线=样本（c（‘低’、‘中’、‘高’、‘NA’），584760，替换=T），”
fm <- df %>% 
  mutate(female = if_else(gender == 'Female', 1, 0)) %>% # make a column that has value 1 if female, otherwise value is 0
  group_by(engagement_overall, province) %>% # 
  summarise(perc_female = mean(female))

prv <- df %>% 
  group_by(engagement_overall, province) %>% 
  summarise(prov_count = n()) %>% 
  group_by(engagement_overall) %>% 
  mutate(total = sum(prov_count),
         prov_count_freq = prov_count/total) %>% 
  select(engagement_overall, province, prov_count_freq)

summary_df <- 
  df %>% 
  group_by(engagement_overall, province) %>% 
  summarise(avg_age = mean(age)) %>% 
  ungroup() %>% 
  inner_join(fm) %>% 
  inner_join(prv)

df %>% 
  group_by(engagement_overall, province, baseline) %>% 
  summarise(count = n()) %>% 
  filter(count == max(count))

?case_when