R 参考旧度量的长格式回归模型?
假设我有一个实验,在这个实验中,我对一群人重复测量。R 参考旧度量的长格式回归模型?,r,regression,R,Regression,假设我有一个实验,在这个实验中,我对一群人重复测量。 下图显示了每次对每个人采取的措施。 数据可以存储在一个宽格式的表格中,每个表格一行。 ID x1 x2 x3 x4 y1 y2 y3 y4 或者它也可以以更紧凑的长格式存储,如下所示: ID T X Y 式中T为1、2、3或4。就目前而言,保持简单,T增量总是相同的,1个单位 我已经看到并使用这种长格式来拟合带有虚拟变量的回归模型。 我通常用R(语法为“Y~X*T”,其中T是一个因子),但它可以用不同的方式在许多其他程序上实现 在这种情况下
下图显示了每次对每个人采取的措施。
数据可以存储在一个宽格式的表格中,每个表格一行。
ID x1 x2 x3 x4 y1 y2 y3 y4 或者它也可以以更紧凑的长格式存储,如下所示: ID T X Y 式中T为1、2、3或4。就目前而言,保持简单,T增量总是相同的,1个单位 我已经看到并使用这种长格式来拟合带有虚拟变量的回归模型。
我通常用R(语法为“Y~X*T”,其中T是一个因子),但它可以用不同的方式在许多其他程序上实现 在这种情况下,您可以找到每个y与其对应的x(同时)之间的关系。
这类似于说:
y1 = a1 + b1·X1
y2 = a2 + b2·X2
y3 = a3 + b3·X3
但是你可以得到更多的能量,因为你可以一起分析所有的数据。
通常我使用lme4来考虑重复测量。但是暂时忘掉它
我的问题是,是否可以使用“长格式”来查找这样的关系?
y1 = a10 + a11·X1
y2 = a20 + a21·X1 + a22·X2
y3 = a30 + a31·X1 + a32·X2 + a33·X3
y1=a10+a11·X1
y2=a20+a21·X1+a22·X2
y3=a30+a31·X1+a32·X2+a33·X3
我的意思是,每个“y”不仅取决于同一时间的“x”,还取决于之前的“x”。(有点累积效应)
或者,我是否被迫使用广泛的格式并创建新的变量
我认为宽格式的问题在于,我们将失去对时间T的显式依赖。我想看看结果如何取决于它。
我发现使用长格式更容易
如果您想要一个非常简单的可复制示例:
set.seed(1)
ID <- rep(1:4,each=4)
XX <- round(runif(16),3)
TT <- rep(1:4, 4)
YY <- ave(XX*TT,ID, FUN = cumsum)
data.frame(ID,TT,XX, YY)
ID TT XX YY
1 1 0.266 0.266
1 2 0.372 1.010
1 3 0.573 2.729
1 4 0.908 6.361
2 1 0.202 0.202
2 2 0.898 1.998
2 3 0.945 4.833
2 4 0.661 7.477
3 1 0.629 0.629
3 2 0.062 0.753
3 3 0.206 1.371
3 4 0.177 2.079
4 1 0.687 0.687
4 2 0.384 1.455
4 3 0.770 3.765
4 4 0.498 5.757
set.seed(1)
身份证件