Stata多项式回归-后估计Wald检验
我在Stata进行了多项逻辑回归分析,然后进行了Wald测试,希望有人能确认我的代码正在做我认为它正在做的事情 注:我用斯塔塔的一些示例数据来说明。我为这个例子进行的分析是完全没有意义的,但是使用了与我的“真实”分析相同的过程,不同的是,我的真实分析还包括一些概率权重和其他协变量Stata多项式回归-后估计Wald检验,stata,logistic-regression,multinomial,Stata,Logistic Regression,Multinomial,我在Stata进行了多项逻辑回归分析,然后进行了Wald测试,希望有人能确认我的代码正在做我认为它正在做的事情 注:我用斯塔塔的一些示例数据来说明。我为这个例子进行的分析是完全没有意义的,但是使用了与我的“真实”分析相同的过程,不同的是,我的真实分析还包括一些概率权重和其他协变量 sysuse auto.dta 首先,我进行多项逻辑回归,从“国外”和“价格”预测“维修记录”: mlogit rep78 i.foreign price, base(1) rrr nolog Multinomia
sysuse auto.dta
首先,我进行多项逻辑回归,从“国外”和“价格”预测“维修记录”:
mlogit rep78 i.foreign price, base(1) rrr nolog
Multinomial logistic regression Number of obs = 69
LR chi2(8) = 31.15
Prob > chi2 = 0.0001
Log likelihood = -78.116372 Pseudo R2 = 0.1662
------------------------------------------------------------------------------
rep78 | RRR Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1 | (base outcome)
-------------+----------------------------------------------------------------
2 |
foreign |
Foreign | .7822853 1672.371 -0.00 1.000 0 .
price | 1.000414 .0007027 0.59 0.556 .9990375 1.001792
_cons | .5000195 1.669979 -0.21 0.836 .000718 348.2204
-------------+----------------------------------------------------------------
3 |
foreign |
Foreign | 686842 1.30e+09 0.01 0.994 0 .
price | 1.000462 .0006955 0.66 0.507 .9990996 1.001826
_cons | 1.254303 4.106511 0.07 0.945 .0020494 767.6863
-------------+----------------------------------------------------------------
4 |
foreign |
Foreign | 6177800 1.17e+10 0.01 0.993 0 .
price | 1.000421 .0006999 0.60 0.547 .9990504 1.001794
_cons | .5379627 1.7848 -0.19 0.852 .0008067 358.7452
-------------+----------------------------------------------------------------
5 |
foreign |
Foreign | 2.79e+07 5.29e+10 0.01 0.993 0 .
price | 1.000386 .0007125 0.54 0.587 .9989911 1.001784
_cons | .146745 .5072292 -0.56 0.579 .0001676 128.4611
------------------------------------------------------------------------------
第二,我想知道结果类别4的“国外”系数是否与结果类别5的“国外”系数有显著差异。所以,我运行了一个Wald测试:
test [4]1.foreign = [5]1.foreign
( 1) [4]1.foreign - [5]1.foreign = 0
chi2( 1) = 2.72
Prob > chi2 = 0.0988
由此,我得出结论,结果类别4的“国外”系数与结果类别5的“国外”系数没有显著差异。更简单地说,“外来”和“修复4”(与“修复1”相比)之间的关联等于“外来”和“修复5”(与“修复1”相比)之间的关联
我的Wald测试代码,以及我对它所做和显示的推断是否正确?此外,对于评论中讨论的内容,您还可以使用以下代码执行似然比测试
sysuse auto.dta
qui mlogit rep78 i.foreign price, base(1) rrr nolog
estimate store unrestricted
constraint 1 [4]1.foreign = [5]1.foreign
qui mlogit rep78 i.foreign price, base(1) rrr nolog constraints(1)
estimate store restricted
lrtest unrestricted restricted
测试的输出显示了与Wald测试相同的结论,但它具有更好的特性,如下所述
Likelihood-ratio test LR chi2(1) = 3.13
(Assumption: restricted nested in unrestricted) Prob > chi2 = 0.0771
引用来自mlogit
测试产生的结果是基于系数估计协方差矩阵的近似值。由于未投保的概率很低,未投保的对数可能性可能是非线性的。传统的统计智慧不是在这些情况下相信渐近答案,而是进行似然比检验
此外,对于评论中讨论的内容,您还可以使用以下代码执行似然比测试
sysuse auto.dta
qui mlogit rep78 i.foreign price, base(1) rrr nolog
estimate store unrestricted
constraint 1 [4]1.foreign = [5]1.foreign
qui mlogit rep78 i.foreign price, base(1) rrr nolog constraints(1)
estimate store restricted
lrtest unrestricted restricted
测试的输出显示了与Wald测试相同的结论,但它具有更好的特性,如下所述
Likelihood-ratio test LR chi2(1) = 3.13
(Assumption: restricted nested in unrestricted) Prob > chi2 = 0.0771
引用来自mlogit
测试产生的结果是基于系数估计协方差矩阵的近似值。由于未投保的概率很低,未投保的对数可能性可能是非线性的。传统的统计智慧不是在这些情况下相信渐近答案,而是进行似然比检验
瓦尔德检验的结论是,基于0.05的任意阿尔法,没有证据表明这两种效应之间存在差异。然而,缺乏证据表明两种效应之间存在差异并不等同于证据表明两种效应是相同的。查阅格陵兰等人(2016)《统计检验、P值、置信区间和功率:误解指南》
,了解良好的概述。谢谢你,是的,我同意我在表达与零假设检验相关的解释时有些松懈。但是代码正确吗?是的,代码确实正确,可以执行Wald测试。Wald测试得出结论,基于0.05的任意阿尔法,没有证据表明这两种效应之间存在差异。然而,缺乏证据表明两种效应之间存在差异并不等同于证据表明两种效应是相同的。查阅格陵兰等人(2016)《统计检验、P值、置信区间和功率:误解指南》
,了解良好的概述。谢谢你,是的,我同意我在表达与零假设检验相关的解释时有些松懈。但是代码正确吗?是的,执行Wald测试的代码确实正确。谢谢您的建议!我的分析包括一些概率权重,当我尝试此方法时,Stata产生了以下错误:LR测试可能对具有稳健vce的模型无效。你还有什么进一步的建议吗?如果Wald测试不完全“可信”,那么这是否意味着我也不能做到?这是一个时不时出现的有趣问题。事实上,经常有人问到,StataCorp提供了一个官方解释,你可以找到。简言之,当聚类或使用权重时,观察值不再独立,因此它不是真实的可能性。在这种情况下,应首选瓦尔德试验。这能解决你的问题吗@Alice?谢谢你的建议!我的分析包括一些概率权重,当我尝试此方法时,Stata产生了以下错误:LR测试可能对具有稳健vce的模型无效。你还有什么进一步的建议吗?如果Wald测试不完全“可信”,那么这是否意味着我也不能做到?这是一个时不时出现的有趣问题。事实上,经常有人问到,StataCorp提供了一个官方解释,你可以找到。简言之,当聚类或使用权重时,观察值不再独立,因此它不是真实的可能性。在这种情况下,应首选瓦尔德试验。它解决了你的问题吗@Alice?