R 弗斯湾';s惩罚逻辑回归-高卡方值

R 弗斯湾';s惩罚逻辑回归-高卡方值,r,logistic-regression,chi-squared,R,Logistic Regression,Chi Squared,我正在分析一个家庭预算调查数据集,目的是分析在酒精上花费更多的家庭是否也在其他非必需项目上花费更多,如餐馆和娱乐(大样本量超过200000) 鉴于大量家庭报告这些项目的零支出,我的线性回归模型中存在非正态分布误差,因此使用了逻辑回归。 当我进行逻辑回归时,我遇到了准完全分离。根据文献分析,Firth的惩罚逻辑回归似乎是最合适的: Regression <- logistf(restaurant_spender ~ alc_spender + income_quintiles + eduat

我正在分析一个家庭预算调查数据集,目的是分析在酒精上花费更多的家庭是否也在其他非必需项目上花费更多,如餐馆和娱乐(大样本量超过200000)

鉴于大量家庭报告这些项目的零支出,我的线性回归模型中存在非正态分布误差,因此使用了逻辑回归。 当我进行逻辑回归时,我遇到了准完全分离。根据文献分析,Firth的惩罚逻辑回归似乎是最合适的:

Regression <- logistf(restaurant_spender ~ alc_spender + income_quintiles + eduation_hh, data = alcohol, weights = weight, firth=FALSE)
这会产生我预期的优势比,我的置信区间也有意义。然而,我的卡方值都是无限的

我已将所有自变量与因变量进行了制表,并且没有类别为0(事实上,它们是均匀分布的)。 我的问题是:

1) 在R中运行Firth的惩罚逻辑回归时,我是否有明显的错误

2) 无限的卡方值是不可信的吗

3) 在R中是否有其他方法来测试为什么除了制表独立变量和因变量之外,我得到了准分离


任何帮助都将不胜感激

设置firth=FALSE的原因是什么?你正在用这个进行正常的逻辑回归,这是一个错误。我用TRUE运行了它,得到了类似的结果。谢谢
exp(coef(Regression))