R 有序和非有序因素的解释,与模型总结中的数值预测

R 有序和非有序因素的解释,与模型总结中的数值预测,r,statistics,modeling,categorical-data,R,Statistics,Modeling,Categorical Data,我安装了一个模型,其中: Y~A+A^2+B+混合效应(C) Y是连续的 A是连续的 B实际上指的是一天,现在看起来是这样的: Levels: 1 < 2 < 3 < 4 < 5 < 6 < 7 < 8 < 9 < 11 < 12 Linear mixed model fit by REML ['lmerMod'] Formula: Y ~ A + I(A^2) + B + (1 | mixed.effect.C) Fixed ef

我安装了一个模型,其中:

Y~A+A^2+B+混合效应(C)

Y是连续的 A是连续的 B实际上指的是一天,现在看起来是这样的:

Levels: 1 < 2 < 3 < 4 < 5 < 6 < 7 < 8 < 9 < 11 < 12
Linear mixed model fit by REML ['lmerMod']
Formula: Y ~ A + I(A^2) + B +  (1 | mixed.effect.C)
Fixed effects:
                       Estimate Std. Error t value
(Intercept)              19.04821    0.40926   46.54
A                      -151.01643    7.19035  -21.00
I(A^2)                  457.19856   31.77830   14.39
B.L                      -3.00811    0.29688  -10.13
B.Q                      -0.12105    0.24561   -0.49
B.C                       0.35457    0.24650    1.44
B^4                       0.09743    0.24111    0.40
B^5                      -0.08119    0.22810   -0.36
B^6                       0.19640    0.22377    0.88
B^7                       0.02043    0.21016    0.10
B^8                      -0.48931    0.20232   -2.42
B^9                      -0.43027    0.17798   -2.42
B^10                     -0.13234    0.15379   -0.86
什么是L、Q和C?我需要知道每增加一天(B)对响应(Y)的影响。如何从输出中获取此信息

当我将B视为.numeric时,我得到如下输出:

    Fixed effects:
                       Estimate  Std. Error t value
(Intercept)            20.79679    0.39906   52.11
A                    -152.29941    7.17939  -21.21
I(A^2)                461.89157   31.79899   14.53
B                      -0.27321    0.02391  -11.42

为了得到每增加一天(B)对响应(Y)的影响,我是否应该将B的系数乘以B(天数)?不确定如何处理此输出…

这实际上不是一个混合的模型特定问题,而是关于R中模型参数化的一般问题

让我们试试一个简单的例子

set.seed(101)
d <- data.frame(x=sample(1:4,size=30,replace=TRUE))
d$y <- rnorm(30,1+2*d$x,sd=0.01)
x作为(无序/常规)因子 截距指定因子基线水平(
x=1
)中
y
的预期值;其他参数指定当
x
采用其他值时
y
的预期值之间的差异

x作为有序因子 现在,截距指定了平均因子水平上的
y
值(介于2和3之间);
L
(线性)参数给出了线性趋势的度量值(我不太确定是否可以解释特定的值……,
Q
C
指定二次项和三次项(在这种情况下,由于模式是线性的,所以它们接近于零);如果有更多的级别,高阶对比度将被编号为5、6、

连续差异对比
此对比度将参数指定为连续级别之间的差值,这些值都是(大约)2的常数值。

这些是正交多项式对比度。大多数人不想使用有序因子,特别是如果他们还不了解这些术语的话。如果你用二次模型进行推理,请学会使用
poly()
而不是
I()
。嗨,本,谢谢你快速、建设性的回答。我完全理解如何解释正则因子的系数,以及给定单个数值解释变量的斜率。所以,如果我有多个解释变量,都是数字,那怎么办?对于Y的单个值,我只是简单地将a的系数乘以a的每个值,将B的系数乘以B的每个值吗?对于大约800个数据点,“B”可以是介于1和12之间的任何数字,“A”在0.0100和0.200之间连续变化。您好。我在理解你答案中的“x作为有序因子”部分时有点困难,所以我问了一个问题。你介意看一下吗?
coef(lm(y~x,d))
## (Intercept)           x 
##   0.9973078   2.0001922 
coef(lm(y~factor(x),d))
## (Intercept)  factor(x)2  factor(x)3  factor(x)4 
##    3.001627    1.991260    3.995619    5.999098 
coef(lm(y~ordered(x),d))
##  (Intercept) ordered(x).L ordered(x).Q ordered(x).C 
##  5.998121421  4.472505514  0.006109021 -0.003125958 
coef(lm(y~factor(x),d,contrasts=list(`factor(x)`=MASS::contr.sdif)))
##  (Intercept) factor(x)2-1 factor(x)3-2 factor(x)4-3 
##     5.998121     1.991260     2.004359     2.003478