R 使用“预测值”;输出方程;heckit模型的设计(样本选择)

R 使用“预测值”;输出方程;heckit模型的设计(样本选择),r,predict,R,Predict,我使用sampleSelection中的heckit模型估计heckit模型 模型如下所示: library(sampleSelection)Heckman=heckit(代理跟踪~SizeCat+log(发行金额)+log(发行日)+log(发行日)+EoW+dMon+EoM+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+TresholdHYIG II,数据=heckmanda,方法=“2step”) 摘要生成一个

我使用sampleSelection中的heckit模型估计heckit模型

模型如下所示:
library(sampleSelection)Heckman=heckit(代理跟踪~SizeCat+log(发行金额)+log(发行日)+log(发行日)+EoW+dMon+EoM+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+VIX(发行日)+TresholdHYIG II,数据=heckmanda,方法=“2step”)

摘要生成一个概率选择方程和一个结果方程-见下文:

Tobit 2 model (sample selection model)
2-step Heckman / heckit estimation
2019085 observations (1915401 censored and 103684 observed)
26 free parameters (df = 2019060)
Probit selection equation:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            0.038164   0.043275   0.882    0.378    
SizeCat2               0.201571   0.003378  59.672  < 2e-16 ***
SizeCat3               0.318331   0.008436  37.733  < 2e-16 ***
log(Amt_Issued)       -0.099472   0.001825 -54.496  < 2e-16 ***
log(daysfromissuance)  0.079691   0.001606  49.613  < 2e-16 ***
log(daystomaturity)   -0.036434   0.001514 -24.066  < 2e-16 ***
EoW                    0.021169   0.003945   5.366 8.04e-08 ***
dMon                  -0.003409   0.003852  -0.885    0.376    
EoM                    0.008937   0.007000   1.277    0.202    
VIX_95_Dummy1          0.088558   0.006521  13.580  < 2e-16 ***
quarter2019.2         -0.092681   0.005202 -17.817  < 2e-16 ***
quarter2019.3         -0.117021   0.005182 -22.581  < 2e-16 ***
quarter2019.4         -0.059833   0.005253 -11.389  < 2e-16 ***
quarter2020.1         -0.005230   0.004943  -1.058    0.290    
quarter2020.2          0.073175   0.005080  14.406  < 2e-16 ***
Outcome equation:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            46.29436    6.26019   7.395 1.41e-13 ***
SizeCat2              -25.63433    0.79836 -32.109  < 2e-16 ***
SizeCat3              -34.25275    1.48030 -23.139  < 2e-16 ***
log(Amt_Issued)        -0.38051    0.39506  -0.963  0.33547    
log(daysfromissuance)   0.02452    0.34197   0.072  0.94283    
log(daystomaturity)     7.92338    0.24498  32.343  < 2e-16 ***
VIX_95_Dummy1          -2.34875    0.89133  -2.635  0.00841 ** 
TresholdHYIG_II1       10.36993    1.07267   9.667  < 2e-16 ***
Multiple R-Squared:0.0406,  Adjusted R-Squared:0.0405
   Error terms:
              Estimate Std. Error t value Pr(>|t|)    
invMillsRatio -23.8204     3.6910  -6.454 1.09e-10 ***
sigma          68.5011         NA      NA       NA    
rho            -0.3477         NA      NA       NA    
SizeCat是一个值为1、2或3的分类/因子变量

我试过不同的方法,例如

predict(Heckman, part ="outcome", newdata = newdata)

我的目标是使用结果方程(包括invMillsRatio)预测一个值(使用
newdata
中的数据)。有没有一种方法可以从结果方程中预测一个值?

使用
预测时,您是否遇到错误?如果是,错误是什么?此外,当您在
newdata
中列出时,您的等式似乎有更多的变量。数据应该包括公式中的所有变量。嗨,奥利弗,谢谢。因为我只想预测“结果方程”,“新数据”中的数据应该包含所有相关变量。错误是:Fehler in
与我有限的荷兰语(或德语?)知识相比,听起来错误似乎来自你的一个因素。不要使用
作为.factor
,您可能应该使用
factor(1,levels=…)
。例如,
SizeCat=factor(1,levels=levels(heckmanda$SizeCat))
以确保因子具有相同的级别数。这可能是程序包的作者实现模型矩阵的方式的一个限制。(使用
Sys.setenv(LANG=“en”)
获取英语错误)英语错误消息:对比
中的错误
predict(Heckman, part ="outcome", newdata = newdata)