R 滞后因变量

R 滞后因变量,r,time-series,R,Time Series,我想使用R计算以下时间序列回归: $\Delta y\u t=\beta\u 1\Delta x\u t+\beta\u 2\Delta z\u t+\beta\u 3\Delta m\u t+\beta\u 4\Delta y{t−1}$ 由于我对R没有太多经验,我想问一下以下R代码是否满足了我的需求: y <- ts(diff(YY)) x <- ts(diff(XX)) z <- ts(diff(ZZ)) m <- ts(diff(MM)) l1 <- lag

我想使用R计算以下时间序列回归:

$\Delta y\u t=\beta\u 1\Delta x\u t+\beta\u 2\Delta z\u t+\beta\u 3\Delta m\u t+\beta\u 4\Delta y{t−1}$

由于我对R没有太多经验,我想问一下以下R代码是否满足了我的需求:

y <- ts(diff(YY))
x <- ts(diff(XX))
z <- ts(diff(ZZ))
m <- ts(diff(MM))
l1 <- lag(y, k=-1)
int <- ts.intersect(y, x, z, m, l1)
reg1 <- lm(y~x+z+m+l1, data=int)
summary(reg1)` 
我尝试了fg nu对我原始问题的回答,但得到了一条错误消息。 1.
zooX=zoo(test4[,-1],order.by=test4$Date)
。(我的数据集的第一列是日期列,因此我的数据集看起来与我问题中的数据样本完全相同。) 2.我运行了回归:
lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)
这里我得到了以下错误消息:
lm.fit中的错误(x,y,offset=offset,singular.ok=singular.ok,…):0(非NA)情况另外:警告消息:在dynlm(d(YY)~d(XX)+d(ZZ)+)+d(ZZ)+)中,d(MM)+L(YY,1),data=zooX):指定的模型框为空
我正在监视的错误是什么?

使用该软件包。以下是使用您提供的数据的示例:

library(dynlm)

dfX = read.table(
  textConnection(
    "Date         YY     XX       ZZ      MM
  03.01.2005  2.154   2.089   0.001   344999
  04.01.2005  2.151   2.084   0.006   344999
  05.01.2005  2.151   2.087   -0.007  333998
  06.01.2005  2.15    2.085   -0.005  333998
  07.01.2005  2.146   2.086   -0.006  333998
  10.01.2005  2.146   2.087   -0.007  333998
  11.01.2005  2.146   2.089   -0.009  333998
  12.01.2005  2.145   2.085   -0.005  339999
  13.01.2005  2.144   2.084   -0.004  339999
  14.01.2005  2.144   2.085   -0.005  339999
  17.01.2005  2.143   2.085   -0.005  339999
  18.01.2005  2.144   2.085   -0.005  347999
  19.01.2005  2.143   2.086   -0.006  354499
  20.01.2005  2.144   2.087   -0.007  354499
  21.01.2005  2.143   2.087   -0.007  354499
  24.01.2005  2.143   2.086   -0.006  354499
  25.01.2005  2.144   2.086   -0.006  354499
  26.01.2005  2.143   2.086   -0.006  347999
  27.01.2005  2.144   2.085   -0.005  352998
  28.01.2005  2.144   2.084   -0.004  352998
  31.01.2005  2.142   2.084   -0.004  352998
  01.02.2005  2.142   2.083   -0.003  352998
  02.02.2005  2.141   2.083   -0.003  357499
  03.02.2005  2.144   2.088   -0.008  357499
  04.02.2005  2.142   2.084   -0.004  357499
  07.02.2005  2.142   2.084   -0.004  359999
  08.02.2005  2.141   2.083   -0.003  355500"
  ), header = TRUE)
dfX$Date = as.Date(dfX$Date, format = "%d.%m.%Y")

# convert to zoo format
zooX = zoo(dfX[, -1], order.by = dfX$Date)

# run a regression with time transformed regressors
lmX = dynlm(d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)), data = zooX)
summary(lmX)
这将提供以下输出:

> summary(lmX)

Time series regression with "zoo" data:
Start = 2005-01-05, End = 2005-02-08

Call:
dynlm(formula = d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)), 
    data = zooX)

Residuals:
       Min         1Q     Median         3Q        Max 
-0.0039592 -0.0003746  0.0000854  0.0006254  0.0018715 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)  
(Intercept) -5.008e-04  2.766e-04  -1.811   0.0853 .
d(XX)        2.943e-01  2.409e-01   1.222   0.2359  
d(ZZ)        2.038e-03  1.715e-01   0.012   0.9906  
d(MM)        7.808e-08  8.251e-08   0.946   0.3553  
d(L(YY, 1)) -1.677e-01  2.103e-01  -0.797   0.4346  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.001248 on 20 degrees of freedom
Multiple R-squared:  0.2579,    Adjusted R-squared:  0.1095 
F-statistic: 1.738 on 4 and 20 DF,  p-value: 0.1813

如果按照要求设置了
int
,请提供一个可复制的示例。但是,可能无法正确处理自相关,最好检查残差图等。谢谢!如果按要求设置了
int
,您的意思是什么?您的数据中可能有一个字符列,这意味着您的整个
zoo
矩阵将向上转换为字符,这意味着
lm
抱怨
0(非NA)情况,因为以字符串/字符表示的数字无效。确定,我从我的数据集中删除了日期列,然后运行:
zooX=zoo(test4)
,然后是
lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)summary(lmX)
现在它似乎可以工作了。在你的代码中我仍然不理解的是,如果
L(YY,1)
YY
的差异的滞后,或者如果它只是
YY
的滞后,即不是差异?谢谢。但是为什么要使用dynlm包呢?我无法在R中复制您的代码。我是这样做的:
zooX=zoo(test4[,-1],order.by=test4$Date)
,因为我加载到R中的CSV文件称为test4)。但是当我点击时:
lmX=dynlm(d(YY)~d(XX)+d(ZZ)+d(MM)+L(YY,1),data=zooX)
会弹出以下错误消息:
lm.fit中的错误(x,y,offset=offset,singular.ok=singular.ok,…):0(非NA)情况另外:警告消息:在dynlm(d(d(YY)~d(XX)+d(ZZ)+)+d(ZZ)+d(MM)+d(YY,1),data=zooX):指定的模型框为空
。你的结果不应该和我的一样吗?@MichaelB因为
dynlm
的构建正是为了简化你正在运行的时间序列回归。请添加您面对问题的描述。我猜日期列不是数据集的第一列(
test4[,-1]
),谢谢!但是除了我的代码效率不高之外,它是否给了我想要的结果?(正如我的问题:在差分自变量x,z,m上加上差分自变量y的第一个滞后上重新计算差分因变量y。)即使它不是有效的,我的代码是否正确指定了?(它会产生与您的代码相同的回归结果吗?为了检查我的代码是否有效,我尝试手动计算ADF测试(来自包
urca
)(即使用ts.intersect),我得到了相同的结果,但仍然担心可能会出错。
> summary(lmX)

Time series regression with "zoo" data:
Start = 2005-01-05, End = 2005-02-08

Call:
dynlm(formula = d(YY) ~ d(XX) + d(ZZ) + d(MM) + d(L(YY, 1)), 
    data = zooX)

Residuals:
       Min         1Q     Median         3Q        Max 
-0.0039592 -0.0003746  0.0000854  0.0006254  0.0018715 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)  
(Intercept) -5.008e-04  2.766e-04  -1.811   0.0853 .
d(XX)        2.943e-01  2.409e-01   1.222   0.2359  
d(ZZ)        2.038e-03  1.715e-01   0.012   0.9906  
d(MM)        7.808e-08  8.251e-08   0.946   0.3553  
d(L(YY, 1)) -1.677e-01  2.103e-01  -0.797   0.4346  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.001248 on 20 degrees of freedom
Multiple R-squared:  0.2579,    Adjusted R-squared:  0.1095 
F-statistic: 1.738 on 4 and 20 DF,  p-value: 0.1813