如何总结R中的比例?
我希望通过购买类别(15个类别)来表示年龄组(两个年龄组)的比例,以便进行两个样本的比例测试 数据如下 类别 同龄人 蔬菜 较年轻的 饮料 中老年 蔬菜 较年轻的 家禽 中老年如何总结R中的比例?,r,R,我希望通过购买类别(15个类别)来表示年龄组(两个年龄组)的比例,以便进行两个样本的比例测试 数据如下 类别 同龄人 蔬菜 较年轻的 饮料 中老年 蔬菜 较年轻的 家禽 中老年 您的所有数据都是分类的(R术语中的“因子”),因此您可能希望使用表而不是聚合: >x表(x) 年龄 猫老幼 贝弗10 保安局10 素食0.2 您需要这样的东西吗 df <- data.frame(category = c("vegetable", "beverages", &
您的所有数据都是分类的(R术语中的“因子”),因此您可能希望使用表而不是聚合:
>x表(x)
年龄
猫老幼
贝弗10
保安局10
素食0.2
您需要这样的东西吗
df <- data.frame(category = c("vegetable", "beverages", "vegetable", "poultry"),
group = c("younger", "middle and older", "younger", "middle and older"))
df %<>%
group_by(group) %>%
summarise(n = n()) %>%
mutate(freq = n/sum(n))
df%
总结(n=n())%>%
变异(频率=n/和(n))
输出:
> df
# A tibble: 2 x 3
group n freq
<chr> <int> <dbl>
1 middle and older 2 0.5
2 younger 2 0.5
>df
#一个tibble:2x3
n组频率
1中老年人2 0.5
2 0.5
您的“x”是因子
和总和
期望数值
。也许您需要newdata$category您想知道比例吗?如果是这样,您可以使用比例(表(newdata$category,newdata$agegroups))
。您对共享数据的预期输出是什么?另外,请以可复制的格式共享数据。
> df
# A tibble: 2 x 3
group n freq
<chr> <int> <dbl>
1 middle and older 2 0.5
2 younger 2 0.5