Data science 什么是好的VIF阈值?
我试图计算连续特征的变异膨胀系数。这里cnt是我的目标变量,并且注册了相关的变量 注册变量与cnt具有高度相关性(0.90)。 我还在VIF测试中添加了一个常量值 我的问题是是否应该从数据集中删除已注册的变量? 此外,什么是可接受的VIF阈值? 有许多来源引用了不同的vif阈值,我遇到的最多值是10 以下是我的Vif代码:Data science 什么是好的VIF阈值?,data-science,Data Science,我试图计算连续特征的变异膨胀系数。这里cnt是我的目标变量,并且注册了相关的变量 注册变量与cnt具有高度相关性(0.90)。 我还在VIF测试中添加了一个常量值 我的问题是是否应该从数据集中删除已注册的变量? 此外,什么是可接受的VIF阈值? 有许多来源引用了不同的vif阈值,我遇到的最多值是10 以下是我的Vif代码: #Variation Inflation Factor X = add_constant(data_num) vif=pd.Series([variance_inflatio
#Variation Inflation Factor
X = add_constant(data_num)
vif=pd.Series([variance_inflation_factor(X.values, i) for i in range(X.shape[1])], index=X.columns)
输出:
const 50.091502
casual 2.004372
registered 10.598306
cnt 13.641529
hum_100 1.179175
atemp_50 2.155207
windspeed_67 1.107981