Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
svyglm中的负调整R平方_R_Statistics_Data Science_Survey - Fatal编程技术网

svyglm中的负调整R平方

svyglm中的负调整R平方,r,statistics,data-science,survey,R,Statistics,Data Science,Survey,我有一个大型、加权和分层数据集,其中包括每户二氧化碳排放量。变量total_co2等于总和elec_co2+gas_co2+oil_co2。在转向更复杂的关系之前,我试图构建一个看似显而易见的模型 svy <- svydesign(id=~i_psu, strata=~i_strata, weights=~i_hhdenui_xw, data=df1) model <- svygl

我有一个大型、加权和分层数据集,其中包括每户二氧化碳排放量。变量
total_co2
等于总和
elec_co2+gas_co2+oil_co2
。在转向更复杂的关系之前,我试图构建一个看似显而易见的模型

svy <- svydesign(id=~i_psu,
                 strata=~i_strata,
                 weights=~i_hhdenui_xw,
                 data=df1)

model <- svyglm(total_co2 ~ elec_co2, svy)
summ(model)
虽然
R^2
表示某种解释力,但
Adj。R^2
为负值,通常被解释为表示相反。在如此简单的关系中,这怎么可能呢?负值从何而来?我应该如何解释它

这是一个简单的数据图。
简短回答:调整后的R平方公式允许否定回答,如果所选模型拟合程度比水平线差,则R平方为否定

长答覆: 另一个评论更深入地探讨了负R平方值:

本网页深入介绍了调整后的R平方公式:


我建议尝试其他模型,或分别添加电co2、气体co2和石油co2。

简短回答:调整后的R平方公式允许否定回答,如果所选模型的拟合程度比水平线差,则R平方为负

长答覆: 另一个评论更深入地探讨了负R平方值:

本网页深入介绍了调整后的R平方公式:


我建议尝试其他型号,或者分别添加电二氧化碳、气体二氧化碳和石油二氧化碳。

你好,莎拉,谢谢你的快速回复。实际上,co2总量被建模为包含elec_co2的总和:
df$total_co2在这种情况下,由于因变量仅为co2总量,因此您可以忽略调整后的R平方。我对线性回归的理解是,只有当有两个或更多因变量时,才使用调整后的R平方。如果你运行的模型包括总co2和电co2(或气体co2或石油co2),调整后的R平方值会变化吗?我试图查看svydesign的文档,找出为什么调整后的R平方会为负值,但我没有找到答案。因此,另一个选择是尝试不同的R包来计算线性回归模型,以检查R平方和调整后的R平方值。我成功地使用了lm()函数,再次感谢您分享您的经验。事实上,如果我加入气体co2,调节R^2变为正。但是在这个例子中,R^2已经非常接近于1。总的来说,我观察到。我使用加权线性回归和
surveyglm
得到的R^2值比我从标准
glm
中得到的不带权重的值要低得多。我想这与如何通过
surveyglm
将权重合并到adj R^2的计算中有关。现在,我将使用adj R^2的值,而不是作为模型性能的绝对指标,而是作为两个模型之间的相对度量。感谢您的快速回复。实际上,co2总量被建模为包含elec_co2的总和:
df$total_co2在这种情况下,由于因变量仅为co2总量,因此您可以忽略调整后的R平方。我对线性回归的理解是,只有当有两个或更多因变量时,才使用调整后的R平方。如果你运行的模型包括总co2和电co2(或气体co2或石油co2),调整后的R平方值会变化吗?我试图查看svydesign的文档,找出为什么调整后的R平方会为负值,但我没有找到答案。因此,另一个选择是尝试不同的R包来计算线性回归模型,以检查R平方和调整后的R平方值。我成功地使用了lm()函数,再次感谢您分享您的经验。事实上,如果我加入气体co2,调节R^2变为正。但是在这个例子中,R^2已经非常接近于1。总的来说,我观察到。我使用加权线性回归和
surveyglm
得到的R^2值比我从标准
glm
中得到的不带权重的值要低得多。我想这与如何通过
surveyglm
将权重合并到adj R^2的计算中有关。现在,我将使用adj R^2的值,而不是作为模型性能的绝对指标,而是作为两个模型之间的相对度量
MODEL INFO:
Observations: 6826
Dependent Variable: total_co2
Type: Survey-weighted linear regression 

MODEL FIT:
R² = 0.31
Adj. R² = -1.74 

Standard errors: Robust
---------------------------------------------------
                       Est.    S.E.   t val.      p
----------------- --------- ------- -------- ------
(Intercept)         1962.48   83.68    23.45   0.00
elec_co2               1.27    0.05    23.98   0.00
---------------------------------------------------

Estimated dispersion parameter = 4390445