Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何在已生成计数的可变级别内计算描述性统计?_R - Fatal编程技术网

R 如何在已生成计数的可变级别内计算描述性统计?

R 如何在已生成计数的可变级别内计算描述性统计?,r,R,我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量(基线、经验和总体参与度),并计算了每个变量的样本量。下面是使用此代码的一个示例: Engagement <- Users %>% group_by(Engagement_overall)%>% summarise(engagement_count=n()) Engagement% 分组依据(参与度总体)%>% 总结(参与人数=n() 我试图计算平均年龄、女性百分比、该省百分比(安

我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量(基线、经验和总体参与度),并计算了每个变量的样本量。下面是使用此代码的一个示例:

Engagement <- 
    Users %>%
    group_by(Engagement_overall)%>%
    summarise(engagement_count=n())
Engagement%
分组依据(参与度总体)%>%
总结(参与人数=n()

我试图计算平均年龄、女性百分比、该省百分比(安大略省、不列颠哥伦比亚省和纽芬兰拉布拉多省)、个人收入中位数以及各参与度水平(包括基线和经验的其他变量)内每天的基线平均步数。除基线每日平均步数外,上述所有变量均包含在主数据框中。用户:


我如何编写一个代码,将指标(平均年龄、女性百分比、省份百分比、个人收入中位数和每天基线平均步数)包含在每个参与度水平中?基线和经验也有4个级别。感谢您提供的帮助。

一种方法是分别制作表,然后将所有表连接起来。例如,我随机生成了一些数据:

库(tidyverse)

如果你还有年龄、性别等栏。。在
Users
数据框中,您应该能够不断向
summary
命令添加列,并用逗号分隔。示例:
总结(订婚人数=n(),平均年龄=mean(年龄),…)
非常感谢。有几个错误我希望你能帮我解决。我将在下面的回答中详细说明,因为用户的字符计数限制伴随着:income_level=sample(c('province=sample(c('ON','BC','NL'),584760,replace=T),错误:意外的,'in“province=sample(c('ON','BC NL'),584760,replace=T),”>基线=样本(c(‘低’、‘中’、‘高’、‘NA’),584760,替换=T),错误:意外“,‘在’基线=样本(c(‘低’、‘中’、‘高’、‘NA’),584760,替换=T),”
fm <- df %>% 
  mutate(female = if_else(gender == 'Female', 1, 0)) %>% # make a column that has value 1 if female, otherwise value is 0
  group_by(engagement_overall, province) %>% # 
  summarise(perc_female = mean(female))
prv <- df %>% 
  group_by(engagement_overall, province) %>% 
  summarise(prov_count = n()) %>% 
  group_by(engagement_overall) %>% 
  mutate(total = sum(prov_count),
         prov_count_freq = prov_count/total) %>% 
  select(engagement_overall, province, prov_count_freq)
summary_df <- 
  df %>% 
  group_by(engagement_overall, province) %>% 
  summarise(avg_age = mean(age)) %>% 
  ungroup() %>% 
  inner_join(fm) %>% 
  inner_join(prv)
df %>% 
  group_by(engagement_overall, province, baseline) %>% 
  summarise(count = n()) %>% 
  filter(count == max(count))
?case_when