Python 常数项(截距)的高VIF表示什么?

Python 常数项(截距)的高VIF表示什么?,python,constants,rfe,Python,Constants,Rfe,我正在使用RFE技术和statsmodels库在汽车数据集上建立一个线性回归模型。我的最终模型的p值在5%以内,并且具有较高的F统计。预测变量的VIF值远低于5,但常数项(截距)的VIF值为8.18。我使用了添加_常数方法将常数添加到模型中。以下是我的疑问: 常数的高方差表示什么 计算VIF时是否应忽略常数项 以下是我的结果: 我是机器学习新手,也是第一次在这个网站上发布问题。如果需要更多信息来回答我的问题,请告诉我。最好在stats.stackexchange上询问统计问题。然而,我只是对

我正在使用RFE技术和statsmodels库在汽车数据集上建立一个线性回归模型。我的最终模型的p值在5%以内,并且具有较高的F统计。预测变量的VIF值远低于5,但常数项(截距)的VIF值为8.18。我使用了添加_常数方法将常数添加到模型中。以下是我的疑问:

  • 常数的高方差表示什么
  • 计算VIF时是否应忽略常数项
  • 以下是我的结果:


    我是机器学习新手,也是第一次在这个网站上发布问题。如果需要更多信息来回答我的问题,请告诉我。

    最好在stats.stackexchange上询问统计问题。然而,我只是对statsmodels进行了介绍,例如

    首先,模型和数据中不存在多重共线性问题。p值很低,置信区间很窄,因此模型中的参数应该是一个很好的估计值。vif为8并不大

    常量中较大的vif表示(斜率)解释变量也具有较大的常量分量。一个例子是,一个变量的平均值很大,但方差很小。设计矩阵的常数和秩缺陷的完美共线的一个例子是伪变量陷阱,当我们在伪编码中没有移除分类变量的一个级别,并且伪变量和为1,因此,复制一个常数时

    在vif计算中包含常数的目的是发现用户提供的设计矩阵exog的此类问题。如果我们在非标准化或标准化的解释变量上计算vif,它就不会出现

    在统计学和计量经济学中,关于多重共线性测度是否应该包含一个常数或只适用于被贬低的解释变量,存在着长期的争论

    我目前正在准备statsmodels的一个扩展,它为用户提供了计算两个版本的选项,有常数和无常数。
    在某些情况下,重新参数化、降级和缩放可以提高数值精度和预测。因此,我们希望有一些措施来检查用户提供的实际设计矩阵,但也要检查数据的标准化版本,看看贬低和缩放是否可以提高数值精度。

    最好在stats.stackexchange上询问统计问题。然而,我只是对statsmodels进行了介绍,例如

    首先,模型和数据中不存在多重共线性问题。p值很低,置信区间很窄,因此模型中的参数应该是一个很好的估计值。vif为8并不大

    常量中较大的vif表示(斜率)解释变量也具有较大的常量分量。一个例子是,一个变量的平均值很大,但方差很小。设计矩阵的常数和秩缺陷的完美共线的一个例子是伪变量陷阱,当我们在伪编码中没有移除分类变量的一个级别,并且伪变量和为1,因此,复制一个常数时

    在vif计算中包含常数的目的是发现用户提供的设计矩阵exog的此类问题。如果我们在非标准化或标准化的解释变量上计算vif,它就不会出现

    在统计学和计量经济学中,关于多重共线性测度是否应该包含一个常数或只适用于被贬低的解释变量,存在着长期的争论

    我目前正在准备statsmodels的一个扩展,它为用户提供了计算两个版本的选项,有常数和无常数。 在某些情况下,重新参数化、降级和缩放可以提高数值精度和预测。因此,我们希望采取措施,检查用户提供的实际设计矩阵,同时检查数据的标准化版本,以查看是否贬低和缩放可能会提高数值精度