R 如何在已生成计数的可变级别内计算描述性统计?
我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量(基线、经验和总体参与度),并计算了每个变量的样本量。下面是使用此代码的一个示例:R 如何在已生成计数的可变级别内计算描述性统计?,r,R,我试图获得详细的描述性统计数据。我从主要数据框用户中选择了三个变量(基线、经验和总体参与度),并计算了每个变量的样本量。下面是使用此代码的一个示例: Engagement <- Users %>% group_by(Engagement_overall)%>% summarise(engagement_count=n()) Engagement% 分组依据(参与度总体)%>% 总结(参与人数=n() 我试图计算平均年龄、女性百分比、该省百分比(安
Engagement <-
Users %>%
group_by(Engagement_overall)%>%
summarise(engagement_count=n())
Engagement%
分组依据(参与度总体)%>%
总结(参与人数=n()
我试图计算平均年龄、女性百分比、该省百分比(安大略省、不列颠哥伦比亚省和纽芬兰拉布拉多省)、个人收入中位数以及各参与度水平(包括基线和经验的其他变量)内每天的基线平均步数。除基线每日平均步数外,上述所有变量均包含在主数据框中。用户:
我如何编写一个代码,将指标(平均年龄、女性百分比、省份百分比、个人收入中位数和每天基线平均步数)包含在每个参与度水平中?基线和经验也有4个级别。感谢您提供的帮助。一种方法是分别制作表,然后将所有表连接起来。例如,我随机生成了一些数据:
库(tidyverse)
如果你还有年龄、性别等栏。。在Users
数据框中,您应该能够不断向summary
命令添加列,并用逗号分隔。示例:总结(订婚人数=n(),平均年龄=mean(年龄),…)
非常感谢。有几个错误我希望你能帮我解决。我将在下面的回答中详细说明,因为用户的字符计数限制伴随着:income_level=sample(c('province=sample(c('ON','BC','NL'),584760,replace=T),错误:意外的,'in“province=sample(c('ON','BC NL'),584760,replace=T),”>基线=样本(c(‘低’、‘中’、‘高’、‘NA’),584760,替换=T),错误:意外“,‘在’基线=样本(c(‘低’、‘中’、‘高’、‘NA’),584760,替换=T),”
fm <- df %>%
mutate(female = if_else(gender == 'Female', 1, 0)) %>% # make a column that has value 1 if female, otherwise value is 0
group_by(engagement_overall, province) %>% #
summarise(perc_female = mean(female))
prv <- df %>%
group_by(engagement_overall, province) %>%
summarise(prov_count = n()) %>%
group_by(engagement_overall) %>%
mutate(total = sum(prov_count),
prov_count_freq = prov_count/total) %>%
select(engagement_overall, province, prov_count_freq)
summary_df <-
df %>%
group_by(engagement_overall, province) %>%
summarise(avg_age = mean(age)) %>%
ungroup() %>%
inner_join(fm) %>%
inner_join(prv)
df %>%
group_by(engagement_overall, province, baseline) %>%
summarise(count = n()) %>%
filter(count == max(count))
?case_when