在R studio中使用长度(唯一)计算具有唯一ID的行
我有一个数据集,其中有人的ID(一些人(ID)有多行)和风险(转录为1到7之间的数字,还有一些NA),我想计算每个风险组中的人数,而不是两次计算同一个人。 当创建仅包含1行/人的子集时,我为每个组获取一定数量的人。但是,当我使用此功能时(针对每个风险组):在R studio中使用长度(唯一)计算具有唯一ID的行,r,unique,R,Unique,我有一个数据集,其中有人的ID(一些人(ID)有多行)和风险(转录为1到7之间的数字,还有一些NA),我想计算每个风险组中的人数,而不是两次计算同一个人。 当创建仅包含1行/人的子集时,我为每个组获取一定数量的人。但是,当我使用此功能时(针对每个风险组): 长度(唯一(数据$person\u id[数据$RISK==1]) 似乎我在每个风险组中多了一个人(总共多了7个人)。 有人对此有解释吗?每次使用此函数时是否必须执行-1 提前感谢!请提供一些示例数据,例如使用dput()library(dp
长度(唯一(数据$person\u id[数据$RISK==1])
似乎我在每个风险组中多了一个人(总共多了7个人)。
有人对此有解释吗?每次使用此函数时是否必须执行-1
提前感谢!请提供一些示例数据,例如使用
dput()
library(dplyr)
数据%>%groupby(RISK)%%>%summary(count=n\u distinct(person\u id))%%>%ungroup()