将拟合威布尔分布(FitDisr)添加到几何图形(ggplot2)分类图
我根据ggplot2中的人口普查数据创建了年龄与人口规模(按性别)的条形图。类似地,我使用FitDistripPlus软件包中的“fitdist”函数来推导归一化(通过所有年龄段的最大观察人口)人口数据的Weibull参数 我想做的是将绘制的数据与分布叠加为线图。我试过了将拟合威布尔分布(FitDisr)添加到几何图形(ggplot2)分类图,r,plot,ggplot2,categorical-data,weibull,R,Plot,Ggplot2,Categorical Data,Weibull,我根据ggplot2中的人口普查数据创建了年龄与人口规模(按性别)的条形图。类似地,我使用FitDistripPlus软件包中的“fitdist”函数来推导归一化(通过所有年龄段的最大观察人口)人口数据的Weibull参数 我想做的是将绘制的数据与分布叠加为线图。我试过了 + geom_line (denscomp(malefit.w)) 加上其他众多(不成功的)策略 任何可以提供的帮助都将不胜感激!请查找下面附加的语法: 数据结构 Order Age Male Fem
+ geom_line (denscomp(malefit.w))
加上其他众多(不成功的)策略
任何可以提供的帮助都将不胜感激!请查找下面附加的语法:
数据结构
Order Age Male Female Total male.norm
1 1 0 - 5 2870000 2820000 5690000 1.00000000
2 2 5 - 9 2430000 2390000 4820000 0.84668990
3 3 10 - 14 2340000 2250000 4590000 0.81533101
4 4 15 - 19 2500000 2500000 5000000 0.87108014
5 5 20 - 24 2690000 2680000 5370000 0.93728223
6 6 25 - 29 2540000 2520000 5060000 0.88501742
7 7 30 - 34 2040000 1990000 4030000 0.71080139
8 8 35 - 39 1710000 1760000 3470000 0.59581882
9 9 40 - 44 1400000 1550000 2950000 0.48780488
10 10 45 - 49 1200000 1420000 2620000 0.41811847
11 11 50 - 54 1010000 1210000 2220000 0.35191638
12 12 55 - 59 812000 985000 1800000 0.28292683
13 13 60 - 64 612000 773000 1390000 0.21324042
14 14 65 - 69 402000 556000 958000 0.14006969
15 15 70 - 74 293000 455000 748000 0.10209059
16 16 75 - 79 165000 316000 481000 0.05749129
17 17 80 - 84 101000 222000 323000 0.03519164
18 18 85 plus 75500 180000 256000 0.02630662
female.norm
1 1.00000000
2 0.84751773
3 0.79787234
4 0.88652482
5 0.95035461
6 0.89361702
7 0.70567376
8 0.62411348
9 0.54964539
10 0.50354610
11 0.42907801
12 0.34929078
13 0.27411348
14 0.19716312
15 0.16134752
16 0.11205674
17 0.07872340
18 0.06382979
这就是我在上面提出的原始问题的答案。结合问题中公布的数据,这是一个从头到尾的解决方案(即绘制原始数据) 南非年龄人口数据(按性别)拟合威布尔分布(Theresa Cain和Ben Small) 加载库
library(MASS)
library(ggplot2)
导入数据集
age_gender2 <- read.csv("age_gender2.csv", sep=",", header = T)
age\u gender2这是我在上面提出的原始问题的答案。结合问题中公布的数据,这是一个从头到尾的解决方案(即绘制原始数据)
南非年龄人口数据(按性别)拟合威布尔分布(Theresa Cain和Ben Small)
加载库
library(MASS)
library(ggplot2)
导入数据集
age_gender2 <- read.csv("age_gender2.csv", sep=",", header = T)
age\u gender2,而不是依赖于我们了解csv文件是如何构造的。相反,您应该用代码构建一个类似的数据集,这样我们就可以看到您在哪里出错了。谢谢您的建议。我通过添加GeoMuSLoad解决了我原来的问题,但是揭示了另一个问题——与我在这里提出的问题无关。请考虑在回答字段中移动你提供给自己的问题的“答案”的假设。TKST,而不是依赖于我们了解您对csv文件是如何构造的想法。相反,您应该用代码构建一个类似的数据集,这样我们就可以看到您在哪里出错了。谢谢您的建议。我通过添加GeoMuSLoad解决了我原来的问题,但是揭示了另一个问题——与我在这里提出的问题无关。请考虑在回答字段中移动你提供给自己的问题的“答案”的假设。Tks
age.all <- matrix(0,1,age.groups)
age.all[1,1] <- 2.5
for(i in 2:age.groups){
age.all[1,i] <- ((5*(i)) - 2.5)
}
male.data <- rep(age.all,age_gender2$Male)
female.data <- rep(age.all,age_gender2$Female)
male.weib <- fitdistr(male.data, "weibull")
female.weib <- fitdistr(female.data, "weibull")
male.shape <- male.weib$estimate[1]
male.scale <- male.weib$estimate[2]
female.shape <- female.weib$estimate[1]
female.scale <- female.weib$estimate[2]
age_gender2["Age_Median"] <- t(age.all)
male.p.weibull <- matrix(0,1,age.groups)
female.p.weibull <- matrix(0,1,age.groups)
for (i in 1:age.groups){
male.p.weibull[1,i] <- pweibull(age.all[1,i]+2.5, male.shape, male.scale) - pweibull(age.all[1,i]-2.5, male.shape, male.scale)
}
for (i in 1:age.groups){
female.p.weibull[1,i] <- pweibull(age.all[1,i]+2.5, female.shape, female.scale) - pweibull(age.all[1,i]-2.5, female.shape, female.scale)
}
age_gender2["male.prob"] <- t(male.p.weibull * total.male)
age_gender2["female.prob"] <- t(female.p.weibull * total.female)
agp.male <- ggplot(age_gender2, aes(x=reorder(Age, Order), y=Male, fill=Male)) + geom_bar(stat="identity") + theme (axis.text.x=element_text(angle=45, hjust=1)) + xlab("Age Group (5 yr bin)") + ylab("Male Population (M)") + geom_smooth(aes(age_gender2$Age,age_gender2$male.prob, group=1))
agp.female <- ggplot(age_gender2, aes(x=reorder(Age, Order), y=Female, fill=Female)) + geom_bar(stat="identity") + theme (axis.text.x=element_text(angle=45, hjust=1)) + xlab("Age Group (5 yr bin)") + ylab("Female Population (M)") + geom_smooth(aes(age_gender2$Age,age_gender2$female.prob, group=1))