R 标记因子和保持数值
我在创建数值和“标签”都可以引用的因子时遇到了一些问题 假设lfactors包可以做到这一点,但是我一直无法执行它。这就是我所做的:R 标记因子和保持数值,r,package,label,factors,R,Package,Label,Factors,我在创建数值和“标签”都可以引用的因子时遇到了一些问题 假设lfactors包可以做到这一点,但是我一直无法执行它。这就是我所做的: library(lfactors) cars <- mtcars str(cars) 'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8
library(lfactors)
cars <- mtcars
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
我仍然无法按级别和值引用因子,因此我想知道是否有人以前使用过此软件包,或者对替代方案有任何建议
一个接近的替代方案,但不完全如此
尽管它并不完美,因为我无法通过值和标签来引用这些因素,但我找到了一种方法,至少让我能够同时存储这两种因素,我认为这可能对处于我的位置的其他人有用:
library(sjlabelled)
library(magrittr)
library(sjmisc)
cars <- mtcars
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
frq(cars$carb)
x <numeric>
# total N=32 valid N=32 mean=2.81 sd=1.62
val frq raw.prc valid.prc cum.prc
1 7 21.88 21.88 21.88
2 10 31.25 31.25 53.12
3 3 9.38 9.38 62.50
4 10 31.25 31.25 93.75
6 1 3.12 3.12 96.88
8 1 3.12 3.12 100.00
NA 0 0.00 NA NA
库(带标签)
图书馆(magrittr)
图书馆(sjmisc)
汽车你一开始就犯了个小错误
cars$carb多亏了@Edward,在提供的指导下,我可以随意玩,并让lfactor函数按我的意愿运行
将lfactor应用于多列的问题
将函数应用于数据数组(而不是单个命名对象;即cars[,9:11]而不是cars$carb)时,它将向量转换为字符而不是向量
cars <- mtcars
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
cars[,9:11] <- lfactor(cars[,9:11],
levels = c(1:4),
labels = c("low", "medium", "high", "extreme"))
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : chr NA NA NA NA ...
$ gear: chr NA NA NA NA ...
$ carb: chr NA NA NA NA ...
我希望这篇文章能帮助其他和我处境相似的人
再次感谢Edward!我在看这行:cars$carb@Edward这是正确的解决方案-将注释转换为答案?非常感谢你,Edward。我犯了一个愚蠢的错误,认为我把c(1:4)放在第一个参数在指定值时,第二行是级别,第三行是标签。有趣的是,当我尝试将其应用于更大的数组时(例如cars[,9:11],它将所有内容转换为字符向量。
library(sjlabelled)
library(magrittr)
library(sjmisc)
cars <- mtcars
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
frq(cars$carb)
x <numeric>
# total N=32 valid N=32 mean=2.81 sd=1.62
val frq raw.prc valid.prc cum.prc
1 7 21.88 21.88 21.88
2 10 31.25 31.25 53.12
3 3 9.38 9.38 62.50
4 10 31.25 31.25 93.75
6 1 3.12 3.12 96.88
8 1 3.12 3.12 100.00
NA 0 0.00 NA NA
cars$carb <- as_factor(cars$carb)
str(cars$carb)
Factor w/ 6 levels "1","2","3","4",..: 4 4 1 1 2 1 4 2 2 4 ...
frq(cars$carb)
<categorical>
# total N=32 valid N=32 mean=2.81 sd=1.62
val frq raw.prc valid.prc cum.prc
1 7 21.88 21.88 21.88
2 10 31.25 31.25 53.12
3 3 9.38 9.38 62.50
4 10 31.25 31.25 93.75
6 1 3.12 3.12 96.88
8 1 3.12 3.12 100.00
NA 0 0.00 NA NA
cars$carb<- set_labels(
cars$carb,
labels = c(
`1` = "low",
`2` = "medium",
`3` = "high",
`4` = "extreme"
))
frq(cars$carb)
<categorical>
# total N=32 valid N=32 mean=2.81 sd=1.62
val label frq raw.prc valid.prc cum.prc
1 low 7 21.88 21.88 21.88
2 medium 10 31.25 31.25 53.12
3 high 3 9.38 9.38 62.50
4 extreme 10 31.25 31.25 93.75
6 6 1 3.12 3.12 96.88
8 8 1 3.12 3.12 100.00
NA <NA> 0 0.00 NA NA
cars[cars$carb==1,]
mpg cyl disp hp drat wt qsec vs am gear carb
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1
cars[cars$carb=="low",]
[1] mpg cyl disp hp drat wt qsec vs am gear carb
<0 rows> (or 0-length row.names)
> mtcars$carb=="medium"
[1] FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE
[25] TRUE FALSE TRUE TRUE FALSE NA NA TRUE
> mtcars$carb==2
[1] FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE
[25] TRUE FALSE TRUE TRUE FALSE NA NA TRUE
> all((mtcars$carb=="medium")==(mtcars$carb==2), na.rm=TRUE)
[1] TRUE
mtcars$carb <- lfactor(c(1:5),
levels = c(1:4),
labels = c("low", "medium", "high", "extreme" ))
Error in `$<-.data.frame`(`*tmp*`, carb, value = c(1L, 2L, 3L, 4L, NA)) :
replacement has 5 rows, data has 32
> table(cars$carb)
low medium high extreme
8 8 8 8
llevels(cars$carb)
NULL
cars <- mtcars
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
cars[,9:11] <- lfactor(cars[,9:11],
levels = c(1:4),
labels = c("low", "medium", "high", "extreme"))
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : chr NA NA NA NA ...
$ gear: chr NA NA NA NA ...
$ carb: chr NA NA NA NA ...
vars <- c("am", "gear", "carb")
for(i in vars){
cars[,i] <- lfactor(cars[,i],
levels = c(1:4),
labels = c("low", "medium", "high", "extreme"))
}
str(cars)
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : Factor w/ 4 levels "low","medium",..: 1 1 1 NA NA NA NA NA NA NA ...
..- attr(*, "llevels")= int 1 2 3 4
$ gear: Factor w/ 4 levels "low","medium",..: 4 4 4 3 3 3 3 4 4 4 ...
..- attr(*, "llevels")= int 1 2 3 4
$ carb: Factor w/ 4 levels "low","medium",..: NA NA NA NA NA NA NA NA NA NA ...
..- attr(*, "llevels")= int 1 2 3 4
head(cars$gear==3)
[1] FALSE FALSE FALSE TRUE TRUE TRUE
head(cars$gear=="high")
[1] FALSE FALSE FALSE TRUE TRUE TRUE