基于可能因素的多种组合减少R中的因素数量
我有一些人口普查数据,人们被允许将他们的种族列为一个或多个不同种族的组合。我们允许他们从这些选择中进行选择 美洲印第安人 东亚 太平洋岛民 黑人还是非裔美国人 白人还是白种人 西班牙裔或拉丁裔/a 南亚 中东 其他 如果你想制作人类种族的列联表,结果数据是相当混乱的,因为我在下面提供了一个样本,数据输出中有一个人列出了许多不同的种族基于可能因素的多种组合减少R中的因素数量,r,R,我有一些人口普查数据,人们被允许将他们的种族列为一个或多个不同种族的组合。我们允许他们从这些选择中进行选择 美洲印第安人 东亚 太平洋岛民 黑人还是非裔美国人 白人还是白种人 西班牙裔或拉丁裔/a 南亚 中东 其他 如果你想制作人类种族的列联表,结果数据是相当混乱的,因为我在下面提供了一个样本,数据输出中有一个人列出了许多不同的种族 structure(list(Race = structure(c(3L, 2L, 3L, 9L, 9L, 11L, 5L, 11L, 3L, 3L, 3L, 3
structure(list(Race = structure(c(3L, 2L, 3L, 9L, 9L, 11L,
5L, 11L, 3L, 3L, 3L, 3L, 7L, 3L, 11L, 5L, 9L, 10L, 9L, 10L, 2L,
3L, 2L, 6L, 9L, 10L, 3L, 10L, 8L, 3L, 5L, 1L, 2L, 9L, 4L, 3L), .Label = c("Black or African American",
"Black or African American,White or Caucasian", "East Asian",
"East Asian,Pacific Islander", "Hispanic or Latino/a", "Other",
"Pacific Islander", "South Asian", "White or Caucasian", "White or Caucasian,Hispanic or Latino/a",
"White or Caucasian,Middle Eastern"), class = "factor")), class = "data.frame", row.names = c(NA,
-36L))
为了减少因子的数量,我想把任何在细胞中有多个种族的细胞变成“混合”。就像这个细胞说的“白人或白种人,中东人”应该变成混合的。因为我的实际数据集是大量的,有多种不同的种族组合,使用类似于
gsub()
的东西,在所有组合中输入以替换为“混合”对我来说似乎不可行 为了方便起见,可以使用dplyr,但也可以使用base
data %>%
mutate(Race = as.character(Race),
Race2 = replace(Race, grepl(",", Race), "Mixed"))
为了方便起见,可以使用dplyr,但也可以使用base
data %>%
mutate(Race = as.character(Race),
Race2 = replace(Race, grepl(",", Race), "Mixed"))
您是否尝试过:data%>%变异(Race=as.character(Race),Race2=replace(Race,grepl(“,”,Race),“Mixed”))您是否尝试过:data%>%变异(Race=as.character(Race),Race2=replace(Race,grepl(“,”,Race),“Mixed”))尽可能在正则表达式函数中使用
fixed=TRUE
。如果我有一些空单元格,但没有提供竞争,有没有办法在不获取的情况下执行此操作
当此函数应用于空单元格时?您希望在空单元格中放置什么?尽可能在正则表达式函数中使用fixed=TRUE
。如果我有一些空单元格,但没有提供竞争,是否有办法在不获取的情况下执行此操作
当此功能应用于空单元格时?您希望在空单元格中放置什么?