Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
带dplyr的加权条件和_R_Group By_Dplyr - Fatal编程技术网

带dplyr的加权条件和

带dplyr的加权条件和,r,group-by,dplyr,R,Group By,Dplyr,提前谢谢你 我有一个关于肥胖与否患者的数据框架(如下示例)。我的特征为Col I,J,K。这是加权数据,因此权重是患者代表的人数。我需要最后一列使用相同的IJK 如果你也有任何关于DPLYR的建议资源和很多例子,我将不胜感激!我已经完成了datacamp课程,并查看了一些额外的资源,但还需要更多的资源 我尝试过,但没有成功 df <- df %>% group_by(col I, col J, col K) %>% mutate(weighted_total_w

提前谢谢你

我有一个关于肥胖与否患者的数据框架(如下示例)。我的特征为Col I,J,K。这是加权数据,因此权重是患者代表的人数。我需要最后一列使用相同的IJK

如果你也有任何关于DPLYR的建议资源和很多例子,我将不胜感激!我已经完成了datacamp课程,并查看了一些额外的资源,但还需要更多的资源

我尝试过,但没有成功

 df <-
  df %>%
  group_by(col I, col J, col K) %>%
  mutate(weighted_total_with_same_IJK=sum(weight))

 df <-
  df %>%
  group_by(col I, col J, col K, col H) %>%
  mutate(percent_obese_with_the_same_IJK=sum(weight)/weighted_total_with_same_IJK)
df%
分组依据(第I列、第J列、第K列)%>%
变异(加权的总重量,相同的总重量=总和(重量))
df%
分组依据(第I列、第J列、第K列、第H列)%>%
变异(肥胖百分比与IJK相同=总和(重量)/加权总与IJK相同)
这应该可以:

df <-
  df %>%
  group_by(col I, col J, col K, col H) %>%
  mutate(percent_obese_with_the_same_IJK = if_else(col H == "obese", weight/sum(weight), "NA_real_"))
df%
分组依据(第I列、第J列、第K列、第H列)%>%
变异(肥胖的百分比与相同的IJK=if-else(列H==“肥胖”,体重/总和(体重),“不真实”))

请用dputt展示一个小的可重复的例子谢谢,我一定会在下一篇文章中包含一个小的可重复的例子!非常感谢你,这真是太棒了!我不知道如何添加if/else来进行变异,这很好地说明了这一点!