R-获取系数中数值和标高标签之间的连接
我正在努力寻找R因子对象中存在的数值(整型)值与其级别标签之间的联系。我知道如何定义标高和标签。但让我们假设我得到了一个不熟悉的数据集,我会在其中找到几个因素(这里:性别和肤色):R-获取系数中数值和标高标签之间的连接,r,r-factor,R,R Factor,我正在努力寻找R因子对象中存在的数值(整型)值与其级别标签之间的联系。我知道如何定义标高和标签。但让我们假设我得到了一个不熟悉的数据集,我会在其中找到几个因素(这里:性别和肤色): test当您有输出时 test$sex [1] female male female female male male female Levels: female male 在称为“级别”的行中,第一个是“女性”,第二个是“男性”,因此“女性”等于1,“男性”等于2 如果您想更改“男性”为1,“女性”为
test当您有输出时
test$sex
[1] female male female female male male female
Levels: female male
在称为“级别”的行中,第一个是“女性”,第二个是“男性”,因此“女性”等于1,“男性”等于2
如果您想更改“男性”为1,“女性”为2,您应该阅读有关函数的内容relevel
:
test$sex <- relevel(test$sex, ref = "male")
test$sex
[1] female male female female male male female
Levels: male female
test$sex当您有输出时
test$sex
[1] female male female female male male female
Levels: female male
在称为“级别”的行中,第一个是“女性”,第二个是“男性”,因此“女性”等于1,“男性”等于2
如果您想更改“男性”为1,“女性”为2,您应该阅读有关函数的内容relevel
:
test$sex <- relevel(test$sex, ref = "male")
test$sex
[1] female male female female male male female
Levels: male female
test$sex因子是按顺序排列的,当您转换为as.numeric时,会给出因子级别,因此您可以执行以下操作:
factors <-data.frame(levels = as.numeric(test$color)[1:length(levels(test$color))], names = paste(levels(test$color)))
factors
factors因子是按顺序排列的,当您转换为as.numeric时,会给出因子级别,因此您可以执行以下操作:
factors <-data.frame(levels = as.numeric(test$color)[1:length(levels(test$color))], names = paste(levels(test$color)))
factors
factors正如其他人所说,整数值只是沿着级别的长度递增。就我个人而言,我发现这最容易在参考表中可视化
test <- data.frame(
sex = factor(c(1,2,1,1,2,2,1),
levels= c(1,2),
labels = c("female", "male")
),
color = factor(c(3,2,2,1,4,4,5),
levels= c(1,2,3,4,5),
labels= c("red", "green", "blue", "yellow", "brown")
)
)
# Make a reference table
data.frame(level = seq_along(levels(test$color)),
label = levels(test$color))
level label
1 1 red
2 2 green
3 3 blue
4 4 yellow
5 5 brown
test正如其他人所说,整数值只是沿着级别的长度递增。就我个人而言,我发现这最容易在参考表中可视化
test <- data.frame(
sex = factor(c(1,2,1,1,2,2,1),
levels= c(1,2),
labels = c("female", "male")
),
color = factor(c(3,2,2,1,4,4,5),
levels= c(1,2,3,4,5),
labels= c("red", "green", "blue", "yellow", "brown")
)
)
# Make a reference table
data.frame(level = seq_along(levels(test$color)),
label = levels(test$color))
level label
1 1 red
2 2 green
3 3 blue
4 4 yellow
5 5 brown
测试您的预期输出是什么?一个表格,它将告诉您哪个数字代表什么?您可以使用levels
功能提取级别。整数值对应于级别在级别向量中的位置。但是你为什么需要这个呢?罗纳克沙:是的,一张桌子就是一个解决方案。我只需要知道哪个数字代表什么@罗兰:我需要这个,因为我经常会得到不熟悉的数据集,其中包含这样的因素。我需要知道“哪个数字代表什么”,以便解释结果。然而,很多时候,我无法问数据集的创建者,原因有很多。您的预期输出是什么?一个表格,它将告诉您哪个数字代表什么?您可以使用levels
功能提取级别。整数值对应于级别在级别向量中的位置。但是你为什么需要这个呢?罗纳克沙:是的,一张桌子就是一个解决方案。我只需要知道哪个数字代表什么@罗兰:我需要这个,因为我经常会得到不熟悉的数据集,其中包含这样的因素。我需要知道“哪个数字代表什么”,以便解释结果。然而,很多时候,由于各种原因,我无法要求数据集的创建者。