将变量重新编码为系数,并在R中指定级别名称

将变量重新编码为系数,并在R中指定级别名称,r,dataframe,mutate,r-factor,R,Dataframe,Mutate,R Factor,使用我的数据集bikeshare我想将变量seasure重新编码为具有有意义的级别名称(即“冬季”、“春季”、“夏季”、“秋季”)的因子,以春季为基线级别 以下是我的尝试: bikeshare <- bikeshare %>% mutate(season = factor(c(1 = "winter", 2 = "spring", 3 = "summer",

使用我的数据集bikeshare我想将变量seasure重新编码为具有有意义的级别名称(即“冬季”、“春季”、“夏季”、“秋季”)的因子,以春季为基线级别

以下是我的尝试:

bikeshare <- bikeshare %>%
mutate(season = factor(c(1 = "winter", 
                      2 = "spring", 
                      3 = "summer", 
                      4 = "fall")))    

我很感激任何帮助,我是初学者

下面是一个如何将数字(
1:4
)转换为因子(“冬季”、“春季”、“夏季”、“秋季”)的示例。关键是使用
因子
功能,并相应地设置
级别
标签

# Create example data frame
bikeshare <- data.frame(season = 1:4)

bikeshare
#   season
# 1      1
# 2      2
# 3      3
# 4      4

library(dplyr)

bikeshare2 <- bikeshare %>%
  mutate(season = factor(as.character(season), 
                         levels = c(1, 2, 3, 4),
                         labels = c("winter", "spring", "summer", "fall")))
bikeshare2
#   season
# 1 winter
# 2 spring
# 3 summer
# 4   fall
#创建示例数据帧

bikeshare要创建因子,您需要向
factor()
函数提供数据和季节标签

但是,由于您希望Spring成为基线级别,我相信您必须按照特定的顺序指定级别和标签-强制Spring成为第一个:

bikeshare季节因素
#>1冬季
#>2.2弹簧
#>3.3夏季
#>4.秋天
由(v0.2.1)于2019-03-03创建


这有点让人困惑,因为在
seasonfactor
中,Spring用1表示,而在原来的
Seasonal
中,它用2表示。

另一种选择是在
标记的
包的帮助下标记整数级别。所以它们仍然是整数,但标签是元数据。如果您想在任何时候将带标签的整数转换为因子,可以使用
to_factor
函数实现

库(“tidyverse”)
图书馆(“贴标签”)
标签%
突变(季节F=到系数(季节))
自行车用品
#>#tibble:4 x 2
#>季候
#>       
#>1[冬季]冬季
#>2[弹簧]弹簧
#>3[夏季]夏季
#>4[跌倒]跌倒
由(v0.2.1)于2019-03-03创建

# Create example data frame
bikeshare <- data.frame(season = 1:4)

bikeshare
#   season
# 1      1
# 2      2
# 3      3
# 4      4

library(dplyr)

bikeshare2 <- bikeshare %>%
  mutate(season = factor(as.character(season), 
                         levels = c(1, 2, 3, 4),
                         labels = c("winter", "spring", "summer", "fall")))
bikeshare2
#   season
# 1 winter
# 2 spring
# 3 summer
# 4   fall