R 滞后因变量
我想使用R计算以下时间序列回归: $\Delta y\u t=\beta\u 1\Delta x\u t+\beta\u 2\Delta z\u t+\beta\u 3\Delta m\u t+\beta\u 4\Delta y{t−1}$ 由于我对R没有太多经验,我想问一下以下R代码是否满足了我的需求:R 滞后因变量,r,time-series,R,Time Series,我想使用R计算以下时间序列回归: $\Delta y\u t=\beta\u 1\Delta x\u t+\beta\u 2\Delta z\u t+\beta\u 3\Delta m\u t+\beta\u 4\Delta y{t−1}$ 由于我对R没有太多经验,我想问一下以下R代码是否满足了我的需求: y <- ts(diff(YY)) x <- ts(diff(XX)) z <- ts(diff(ZZ)) m <- ts(diff(MM)) l1 <- lag
y <- ts(diff(YY))
x <- ts(diff(XX))
z <- ts(diff(ZZ))
m <- ts(diff(MM))
l1 <- lag(y, k=-1)
int <- ts.intersect(y, x, z, m, l1)
reg1 <- lm(y~x+z+m+l1, data=int)
summary(reg1)`
我尝试了fg nu对我原始问题的回答,但得到了一条错误消息。
1. zooX=zoo(test4[,-1],order.by=test4$Date)
。(我的数据集的第一列是日期列,因此我的数据集看起来与我问题中的数据样本完全相同。)
2.我运行了回归:lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)
这里我得到了以下错误消息:lm.fit中的错误(x,y,offset=offset,singular.ok=singular.ok,…):0(非NA)情况另外:警告消息:在dynlm(d(YY)~d(XX)+d(ZZ)+)+d(ZZ)+)中,d(MM)+L(YY,1),data=zooX):指定的模型框为空
我正在监视的错误是什么?使用该软件包。以下是使用您提供的数据的示例:
library(dynlm)
dfX = read.table(
textConnection(
"Date YY XX ZZ MM
03.01.2005 2.154 2.089 0.001 344999
04.01.2005 2.151 2.084 0.006 344999
05.01.2005 2.151 2.087 -0.007 333998
06.01.2005 2.15 2.085 -0.005 333998
07.01.2005 2.146 2.086 -0.006 333998
10.01.2005 2.146 2.087 -0.007 333998
11.01.2005 2.146 2.089 -0.009 333998
12.01.2005 2.145 2.085 -0.005 339999
13.01.2005 2.144 2.084 -0.004 339999
14.01.2005 2.144 2.085 -0.005 339999
17.01.2005 2.143 2.085 -0.005 339999
18.01.2005 2.144 2.085 -0.005 347999
19.01.2005 2.143 2.086 -0.006 354499
20.01.2005 2.144 2.087 -0.007 354499
21.01.2005 2.143 2.087 -0.007 354499
24.01.2005 2.143 2.086 -0.006 354499
25.01.2005 2.144 2.086 -0.006 354499
26.01.2005 2.143 2.086 -0.006 347999
27.01.2005 2.144 2.085 -0.005 352998
28.01.2005 2.144 2.084 -0.004 352998
31.01.2005 2.142 2.084 -0.004 352998
01.02.2005 2.142 2.083 -0.003 352998
02.02.2005 2.141 2.083 -0.003 357499
03.02.2005 2.144 2.088 -0.008 357499
04.02.2005 2.142 2.084 -0.004 357499
07.02.2005 2.142 2.084 -0.004 359999
08.02.2005 2.141 2.083 -0.003 355500"
), header = TRUE)
dfX$Date = as.Date(dfX$Date, format = "%d.%m.%Y")
# convert to zoo format
zooX = zoo(dfX[, -1], order.by = dfX$Date)
# run a regression with time transformed regressors
lmX = dynlm(d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)), data = zooX)
summary(lmX)
这将提供以下输出:
> summary(lmX)
Time series regression with "zoo" data:
Start = 2005-01-05, End = 2005-02-08
Call:
dynlm(formula = d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)),
data = zooX)
Residuals:
Min 1Q Median 3Q Max
-0.0039592 -0.0003746 0.0000854 0.0006254 0.0018715
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.008e-04 2.766e-04 -1.811 0.0853 .
d(XX) 2.943e-01 2.409e-01 1.222 0.2359
d(ZZ) 2.038e-03 1.715e-01 0.012 0.9906
d(MM) 7.808e-08 8.251e-08 0.946 0.3553
d(L(YY, 1)) -1.677e-01 2.103e-01 -0.797 0.4346
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.001248 on 20 degrees of freedom
Multiple R-squared: 0.2579, Adjusted R-squared: 0.1095
F-statistic: 1.738 on 4 and 20 DF, p-value: 0.1813
如果按照要求设置了
int
,请提供一个可复制的示例。但是,可能无法正确处理自相关,最好检查残差图等。谢谢!如果按要求设置了int
,您的意思是什么?您的数据中可能有一个字符列,这意味着您的整个zoo
矩阵将向上转换为字符,这意味着lm
抱怨0(非NA)情况,因为以字符串/字符表示的数字无效。确定,我从我的数据集中删除了日期列,然后运行:zooX=zoo(test4)
,然后是lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)summary(lmX)
现在它似乎可以工作了。在你的代码中我仍然不理解的是,如果L(YY,1)
是YY
的差异的滞后,或者如果它只是YY
的滞后,即不是差异?谢谢。但是为什么要使用dynlm包呢?我无法在R中复制您的代码。我是这样做的:zooX=zoo(test4[,-1],order.by=test4$Date)
,因为我加载到R中的CSV文件称为test4)。但是当我点击时:lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)
会弹出以下错误消息:lm.fit中的错误(x,y,offset=offset,singular.ok=singular.ok,…):0(非NA)情况另外:警告消息:在dynlm(d(d(YY)~d(XX)+d(ZZ)+)+d(ZZ)+d(MM)+d(YY,1),data=zooX):指定的模型框为空
。你的结果不应该和我的一样吗?@MichaelB因为dynlm
的构建正是为了简化你正在运行的时间序列回归。请添加您面对问题的描述。我猜日期列不是数据集的第一列(test4[,-1]
),谢谢!但是除了我的代码效率不高之外,它是否给了我想要的结果?(正如我的问题:在差分自变量x,z,m上加上差分自变量y的第一个滞后上重新计算差分因变量y。)即使它不是有效的,我的代码是否正确指定了?(它会产生与您的代码相同的回归结果吗?为了检查我的代码是否有效,我尝试手动计算ADF测试(来自包urca
)(即使用ts.intersect),我得到了相同的结果,但仍然担心可能会出错。
> summary(lmX)
Time series regression with "zoo" data:
Start = 2005-01-05, End = 2005-02-08
Call:
dynlm(formula = d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)),
data = zooX)
Residuals:
Min 1Q Median 3Q Max
-0.0039592 -0.0003746 0.0000854 0.0006254 0.0018715
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.008e-04 2.766e-04 -1.811 0.0853 .
d(XX) 2.943e-01 2.409e-01 1.222 0.2359
d(ZZ) 2.038e-03 1.715e-01 0.012 0.9906
d(MM) 7.808e-08 8.251e-08 0.946 0.3553
d(L(YY, 1)) -1.677e-01 2.103e-01 -0.797 0.4346
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.001248 on 20 degrees of freedom
Multiple R-squared: 0.2579, Adjusted R-squared: 0.1095
F-statistic: 1.738 on 4 and 20 DF, p-value: 0.1813