将变量重新编码为系数,并在R中指定级别名称
使用我的数据集bikeshare我想将变量seasure重新编码为具有有意义的级别名称(即“冬季”、“春季”、“夏季”、“秋季”)的因子,以春季为基线级别 以下是我的尝试:将变量重新编码为系数,并在R中指定级别名称,r,dataframe,mutate,r-factor,R,Dataframe,Mutate,R Factor,使用我的数据集bikeshare我想将变量seasure重新编码为具有有意义的级别名称(即“冬季”、“春季”、“夏季”、“秋季”)的因子,以春季为基线级别 以下是我的尝试: bikeshare <- bikeshare %>% mutate(season = factor(c(1 = "winter", 2 = "spring", 3 = "summer",
bikeshare <- bikeshare %>%
mutate(season = factor(c(1 = "winter",
2 = "spring",
3 = "summer",
4 = "fall")))
我很感激任何帮助,我是初学者 下面是一个如何将数字(
1:4
)转换为因子(“冬季”、“春季”、“夏季”、“秋季”)的示例。关键是使用因子
功能,并相应地设置级别
和标签
# Create example data frame
bikeshare <- data.frame(season = 1:4)
bikeshare
# season
# 1 1
# 2 2
# 3 3
# 4 4
library(dplyr)
bikeshare2 <- bikeshare %>%
mutate(season = factor(as.character(season),
levels = c(1, 2, 3, 4),
labels = c("winter", "spring", "summer", "fall")))
bikeshare2
# season
# 1 winter
# 2 spring
# 3 summer
# 4 fall
#创建示例数据帧
bikeshare要创建因子,您需要向factor()
函数提供数据和季节标签
但是,由于您希望Spring成为基线级别,我相信您必须按照特定的顺序指定级别和标签-强制Spring成为第一个:
bikeshare季节因素
#>1冬季
#>2.2弹簧
#>3.3夏季
#>4.秋天
由(v0.2.1)于2019-03-03创建
这有点让人困惑,因为在seasonfactor
中,Spring用1表示,而在原来的Seasonal
中,它用2表示。另一种选择是在标记的包的帮助下标记整数级别。所以它们仍然是整数,但标签是元数据。如果您想在任何时候将带标签的整数转换为因子,可以使用to_factor
函数实现
库(“tidyverse”)
图书馆(“贴标签”)
标签%
突变(季节F=到系数(季节))
自行车用品
#>#tibble:4 x 2
#>季候
#>
#>1[冬季]冬季
#>2[弹簧]弹簧
#>3[夏季]夏季
#>4[跌倒]跌倒
由(v0.2.1)于2019-03-03创建
# Create example data frame
bikeshare <- data.frame(season = 1:4)
bikeshare
# season
# 1 1
# 2 2
# 3 3
# 4 4
library(dplyr)
bikeshare2 <- bikeshare %>%
mutate(season = factor(as.character(season),
levels = c(1, 2, 3, 4),
labels = c("winter", "spring", "summer", "fall")))
bikeshare2
# season
# 1 winter
# 2 spring
# 3 summer
# 4 fall