svyglm中的负调整R平方
我有一个大型、加权和分层数据集,其中包括每户二氧化碳排放量。变量svyglm中的负调整R平方,r,statistics,data-science,survey,R,Statistics,Data Science,Survey,我有一个大型、加权和分层数据集,其中包括每户二氧化碳排放量。变量total_co2等于总和elec_co2+gas_co2+oil_co2。在转向更复杂的关系之前,我试图构建一个看似显而易见的模型 svy <- svydesign(id=~i_psu, strata=~i_strata, weights=~i_hhdenui_xw, data=df1) model <- svygl
total_co2
等于总和elec_co2+gas_co2+oil_co2
。在转向更复杂的关系之前,我试图构建一个看似显而易见的模型
svy <- svydesign(id=~i_psu,
strata=~i_strata,
weights=~i_hhdenui_xw,
data=df1)
model <- svyglm(total_co2 ~ elec_co2, svy)
summ(model)
虽然R^2
表示某种解释力,但Adj。R^2
为负值,通常被解释为表示相反。在如此简单的关系中,这怎么可能呢?负值从何而来?我应该如何解释它
这是一个简单的数据图。
简短回答:调整后的R平方公式允许否定回答,如果所选模型拟合程度比水平线差,则R平方为否定 长答覆: 另一个评论更深入地探讨了负R平方值: 本网页深入介绍了调整后的R平方公式:
我建议尝试其他模型,或分别添加电co2、气体co2和石油co2。简短回答:调整后的R平方公式允许否定回答,如果所选模型的拟合程度比水平线差,则R平方为负 长答覆: 另一个评论更深入地探讨了负R平方值: 本网页深入介绍了调整后的R平方公式:
我建议尝试其他型号,或者分别添加电二氧化碳、气体二氧化碳和石油二氧化碳。你好,莎拉,谢谢你的快速回复。实际上,co2总量被建模为包含elec_co2的总和:
df$total_co2在这种情况下,由于因变量仅为co2总量,因此您可以忽略调整后的R平方。我对线性回归的理解是,只有当有两个或更多因变量时,才使用调整后的R平方。如果你运行的模型包括总co2和电co2(或气体co2或石油co2),调整后的R平方值会变化吗?我试图查看svydesign的文档,找出为什么调整后的R平方会为负值,但我没有找到答案。因此,另一个选择是尝试不同的R包来计算线性回归模型,以检查R平方和调整后的R平方值。我成功地使用了lm()函数,再次感谢您分享您的经验。事实上,如果我加入气体co2,调节R^2变为正。但是在这个例子中,R^2已经非常接近于1。总的来说,我观察到。我使用加权线性回归和surveyglm
得到的R^2值比我从标准glm
中得到的不带权重的值要低得多。我想这与如何通过surveyglm
将权重合并到adj R^2的计算中有关。现在,我将使用adj R^2的值,而不是作为模型性能的绝对指标,而是作为两个模型之间的相对度量。感谢您的快速回复。实际上,co2总量被建模为包含elec_co2的总和:df$total_co2在这种情况下,由于因变量仅为co2总量,因此您可以忽略调整后的R平方。我对线性回归的理解是,只有当有两个或更多因变量时,才使用调整后的R平方。如果你运行的模型包括总co2和电co2(或气体co2或石油co2),调整后的R平方值会变化吗?我试图查看svydesign的文档,找出为什么调整后的R平方会为负值,但我没有找到答案。因此,另一个选择是尝试不同的R包来计算线性回归模型,以检查R平方和调整后的R平方值。我成功地使用了lm()函数,再次感谢您分享您的经验。事实上,如果我加入气体co2,调节R^2变为正。但是在这个例子中,R^2已经非常接近于1。总的来说,我观察到。我使用加权线性回归和surveyglm
得到的R^2值比我从标准glm
中得到的不带权重的值要低得多。我想这与如何通过surveyglm
将权重合并到adj R^2的计算中有关。现在,我将使用adj R^2的值,而不是作为模型性能的绝对指标,而是作为两个模型之间的相对度量
MODEL INFO:
Observations: 6826
Dependent Variable: total_co2
Type: Survey-weighted linear regression
MODEL FIT:
R² = 0.31
Adj. R² = -1.74
Standard errors: Robust
---------------------------------------------------
Est. S.E. t val. p
----------------- --------- ------- -------- ------
(Intercept) 1962.48 83.68 23.45 0.00
elec_co2 1.27 0.05 23.98 0.00
---------------------------------------------------
Estimated dispersion parameter = 4390445