R 使用“预测值”；输出方程；heckit模型的设计（样本选择）_R_Predict

R 使用“预测值”；输出方程；heckit模型的设计（样本选择）

R 使用“预测值”；输出方程；heckit模型的设计（样本选择）,r,predict,R,Predict,我使用sampleSelection中的heckit模型估计heckit模型模型如下所示： library（sampleSelection）Heckman=heckit（代理跟踪~SizeCat+log（发行金额）+log（发行日）+log（发行日）+EoW+dMon+EoM+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+TresholdHYIG II，数据=heckmanda，方法=“2step”）摘要生成一个

我使用sampleSelection中的heckit模型估计heckit模型

模型如下所示：

library（sampleSelection）Heckman=heckit（代理跟踪~SizeCat+log（发行金额）+log（发行日）+log（发行日）+EoW+dMon+EoM+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+VIX（发行日）+TresholdHYIG II，数据=heckmanda，方法=“2step”）

摘要生成一个概率选择方程和一个结果方程-见下文：

Tobit 2 model (sample selection model)
2-step Heckman / heckit estimation
2019085 observations (1915401 censored and 103684 observed)
26 free parameters (df = 2019060)
Probit selection equation:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            0.038164   0.043275   0.882    0.378    
SizeCat2               0.201571   0.003378  59.672  < 2e-16 ***
SizeCat3               0.318331   0.008436  37.733  < 2e-16 ***
log(Amt_Issued)       -0.099472   0.001825 -54.496  < 2e-16 ***
log(daysfromissuance)  0.079691   0.001606  49.613  < 2e-16 ***
log(daystomaturity)   -0.036434   0.001514 -24.066  < 2e-16 ***
EoW                    0.021169   0.003945   5.366 8.04e-08 ***
dMon                  -0.003409   0.003852  -0.885    0.376    
EoM                    0.008937   0.007000   1.277    0.202    
VIX_95_Dummy1          0.088558   0.006521  13.580  < 2e-16 ***
quarter2019.2         -0.092681   0.005202 -17.817  < 2e-16 ***
quarter2019.3         -0.117021   0.005182 -22.581  < 2e-16 ***
quarter2019.4         -0.059833   0.005253 -11.389  < 2e-16 ***
quarter2020.1         -0.005230   0.004943  -1.058    0.290    
quarter2020.2          0.073175   0.005080  14.406  < 2e-16 ***
Outcome equation:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            46.29436    6.26019   7.395 1.41e-13 ***
SizeCat2              -25.63433    0.79836 -32.109  < 2e-16 ***
SizeCat3              -34.25275    1.48030 -23.139  < 2e-16 ***
log(Amt_Issued)        -0.38051    0.39506  -0.963  0.33547    
log(daysfromissuance)   0.02452    0.34197   0.072  0.94283    
log(daystomaturity)     7.92338    0.24498  32.343  < 2e-16 ***
VIX_95_Dummy1          -2.34875    0.89133  -2.635  0.00841 ** 
TresholdHYIG_II1       10.36993    1.07267   9.667  < 2e-16 ***
Multiple R-Squared:0.0406,  Adjusted R-Squared:0.0405
   Error terms:
              Estimate Std. Error t value Pr(>|t|)    
invMillsRatio -23.8204     3.6910  -6.454 1.09e-10 ***
sigma          68.5011         NA      NA       NA    
rho            -0.3477         NA      NA       NA

SizeCat是一个值为1、2或3的分类/因子变量

我试过不同的方法，例如

predict(Heckman, part ="outcome", newdata = newdata)

我的目标是使用结果方程（包括invMillsRatio）预测一个值（使用

newdata

中的数据）。有没有一种方法可以从结果方程中预测一个值？

使用

预测时，您是否遇到错误？如果是，错误是什么？此外，当您在newdata
中列出时，您的等式似乎有更多的变量。数据应该包括公式中的所有变量。嗨，奥利弗，谢谢。因为我只想预测“结果方程”，“新数据”中的数据应该包含所有相关变量。错误是：Fehler in与我有限的荷兰语（或德语？）知识相比，听起来错误似乎来自你的一个因素。不要使用作为.factor
，您可能应该使用factor（1，levels=…）
。例如，SizeCat=factor（1，levels=levels（heckmanda$SizeCat））
以确保因子具有相同的级别数。这可能是程序包的作者实现模型矩阵的方式的一个限制。（使用Sys.setenv（LANG=“en”）
获取英语错误）英语错误消息：对比中的错误
predict(Heckman, part ="outcome", newdata = newdata)