R 用字符串重新编码变量的问题 目标

R 用字符串重新编码变量的问题 目标,r,R,我正在尝试使用不同变量的值并根据特定条件在R中创建一个分类(例如字符串)变量 问题 这似乎并没有实际重新编码数据。我正在转换数据,但我不确定以哪种方式转换 数据说明 我有一个以国家/月份为分析单位的数据框架。其中一个变量是治理,并且是连续的。其范围为0.750至4.333 采取的步骤 我试图创建一个分类变量,在这个变量中,我为4个不同的广泛治理组创建标签 以下是我尝试过的: syndromes$syndrome_cat <- NA syndromes$syndrome_cat[syndro

我正在尝试使用不同变量的值并根据特定条件在R中创建一个分类(例如字符串)变量

问题 这似乎并没有实际重新编码数据。我正在转换数据,但我不确定以哪种方式转换

数据说明 我有一个以国家/月份为分析单位的数据框架。其中一个变量是治理,并且是连续的。其范围为0.750至4.333

采取的步骤 我试图创建一个分类变量,在这个变量中,我为4个不同的广泛治理组创建标签

以下是我尝试过的:

syndromes$syndrome_cat <- NA
syndromes$syndrome_cat[syndromes$governance <= 1.645] <- "Category 1"
syndromes$syndrome_cat[syndromes$governance >= 1.646 & syndromes$governance <= 2.541] <- "Category 2"
syndromes$syndrome_cat[syndromes$governance >= 2.542 & syndromes$governance <= 3.437] <- "Category 3"
syndromes$syndrome_cat[syndromes$governance >= 3.438] <- "Category 3"
当我检查数据时,我看到:

head(syndromes$governance)
[1] NA NA NA NA NA NA
我做错了什么


提前谢谢你

带有
dplyr

mydf %>% 
    mutate(group = case_when(.$governance < 1.646 ~ 'Cat1',
                       between(.$governance, 1.646, 2.541) ~ 'Cat2',
                       between(.$governance, 2.542, 3.437) ~ 'Cat3',
                       .$governance > 3.438 ~ 'Cat4'))
mydf%>%
当(.$governance<1.646~'Cat1'时,突变(组=案例_),
在(.$governance,1.646,2.541)~'Cat2'之间,
在(.$governance,2.542,3.437)~'Cat3'之间,
($governance>3.438~‘Cat4’)
只需使用此选项(正如@Rich Scriven所建议的),您还可以通过包括/排除间隔的左/右侧来更改
cut
的默认行为:

syndromes$syndrome_cat <- cut(syndromes$governance, breaks=c(-Inf,1.645, 2.541, 3.437,Inf), 
                                                    labels=paste('Category', 1:4))

syndromes$syndrome\u cat请参见
help(cut)
。您可以使用新列的结果来剪切治理并创建新标签。我们可能需要您的数据样本来帮助您了解代码失败的地方。。再次检查每列的类型,谢谢,@RichScriven!很好,对不起。。。我在发布时没有看到你的答案这没关系@joel.wilson谢谢,@ggamba-我必须用dplyr试试这个。我感谢你的帮助!
syndromes$syndrome_cat <- cut(syndromes$governance, breaks=c(-Inf,1.645, 2.541, 3.437,Inf), 
                                                    labels=paste('Category', 1:4))