Data science 什么是好的VIF阈值?

Data science 什么是好的VIF阈值?,data-science,Data Science,我试图计算连续特征的变异膨胀系数。这里cnt是我的目标变量,并且注册了相关的变量 注册变量与cnt具有高度相关性(0.90)。 我还在VIF测试中添加了一个常量值 我的问题是是否应该从数据集中删除已注册的变量? 此外,什么是可接受的VIF阈值? 有许多来源引用了不同的vif阈值,我遇到的最多值是10 以下是我的Vif代码: #Variation Inflation Factor X = add_constant(data_num) vif=pd.Series([variance_inflatio

我试图计算连续特征的变异膨胀系数。这里cnt是我的目标变量,并且注册了相关的变量

注册变量与cnt具有高度相关性(0.90)。 我还在VIF测试中添加了一个常量值

我的问题是是否应该从数据集中删除已注册的变量? 此外,什么是可接受的VIF阈值? 有许多来源引用了不同的vif阈值,我遇到的最多值是10

以下是我的Vif代码:

#Variation Inflation Factor
X = add_constant(data_num)
vif=pd.Series([variance_inflation_factor(X.values, i) for i in range(X.shape[1])], index=X.columns)
输出:

const           50.091502
casual           2.004372
registered      10.598306
cnt             13.641529
hum_100          1.179175
atemp_50         2.155207
windspeed_67     1.107981