有没有办法用R中的汇总统计数据来划分组_的答案?
我正在尝试从三个向量中对数据进行子集划分,然后将算术应用于汇总统计数据,但我在count()方面遇到了问题。下面是使用(summary,dplyr)的摘要,但我希望它以未过滤(X_age65yr)的百分比返回。有没有办法用R中的汇总统计数据来划分组_的答案?,r,dplyr,R,Dplyr,我正在尝试从三个向量中对数据进行子集划分,然后将算术应用于汇总统计数据,但我在count()方面遇到了问题。下面是使用(summary,dplyr)的摘要,但我希望它以未过滤(X_age65yr)的百分比返回。 例如,阿拉巴马州的过滤计数结果为1667,总计数为2411。我希望阿拉巴马州和所有后续州返回过滤后的总数,或1667/2411=.6914或69.14% cthigh <- brfss2013 %>% filter(bphigh4 == "Yes", !is.na(X_age
例如,阿拉巴马州的过滤计数结果为1667,总计数为2411。我希望阿拉巴马州和所有后续州返回过滤后的总数,或1667/2411=.6914或69.14%
cthigh <- brfss2013 %>% filter(bphigh4 == "Yes", !is.na(X_age65yr),X_age65yr == "Age 65 or older") %>%
group_by(X_state) %>% summarise(count = n())
cthigh
# A tibble: 53 x 2
X_state count
<fct> <int>
1 Alabama 1667
2 Alaska 507
3 Arizona 930
4 Arkansas 1352
5 California 1817
6 Colorado 2302
7 Connecticut 1488
8 Delaware 1123
9 District of Columbia 1032
10 Florida 8924
# ... with 43 more rows
ctall <- brfss2013 %>% filter(!is.na(X_age65yr),X_age65yr == "Age 65 or older") %>%
group_by(X_state) %>% summarise(count= n())
ctall
# A tibble: 53 x 2
X_state count
<fct> <int>
1 Alabama 2411
2 Alaska 864
3 Arizona 1578
4 Arkansas 2069
5 California 3111
6 Colorado 4067
7 Connecticut 2362
8 Delaware 1786
9 District of Columbia 1683
10 Florida 14245
# ... with 43 more rows
cthigh%filter(bphigh4==“Yes”,!is.na(X_age65yr),X_age65yr==“65岁或以上”)%>%
分组依据(X状态)%>%汇总(计数=n())
cthigh
#A tibble:53 x 2
X_状态计数
阿拉巴马州1667
2阿拉斯加507
3亚利桑那州930
4阿肯色州1352
5加利福尼亚1817
6科罗拉多2302
7康涅狄格州1488
8特拉华1123
9哥伦比亚特区1032
10佛罗里达8924
# ... 还有43行
C所有%filter(!is.na(X_age65yr),X_age65yr==“65岁或以上”)%>%
分组依据(X状态)%>%汇总(计数=n())
克塔尔
#A tibble:53 x 2
X_状态计数
阿拉巴马州2411
2阿拉斯加864
3亚利桑那州1578
4阿肯色州2069
5加利福尼亚3111
6科罗拉多4067
7康涅狄格州2362
8特拉华1786
9哥伦比亚特区1683
10佛罗里达14245
# ... 还有43行
您可以计算bphigh4==“Yes”
的数量,并将其除以每个X_状态中的行数以获得比率
library(dplyr)
brfss2013 %>%
filter(!is.na(X_age65yr) & !is.na(bphigh4),X_age65yr == "Age 65 or older") %>%
group_by(X_state) %>%
summarise(count = sum(bphigh4 == "Yes")/n() * 100)
抱歉耽搁了您的时间;我研究了你的解决方案Ronak,我得到了所有NA,所以在我应用了额外的解决方案之后!对于bphigh4,is.na有效。谢谢大家!@KurtRecker好吧,我是根据你的尝试来帮助你的。我没有您的数据来验证是否有额外的!is.na(bphigh4)
是必需的。当然。我只是为了交换而澄清。我真的很感谢你的帮助。