函数,用于对python中的所有分类变量执行完全的卡方检验和方差分析测试

函数,用于对python中的所有分类变量执行完全的卡方检验和方差分析测试,python,pandas,scipy,anova,chi-squared,Python,Pandas,Scipy,Anova,Chi Squared,我正在研究一个包含分类变量和数值变量的数据集。我想找出变量之间的相关性,如果它们的相关性很大,我想去掉其中一个相关特征。我知道pandasdata.corr()只能用于数值变量和分类变量,只有2个值为0或1。如果我想找到分类变量和一个分类变量之间的相关性,我学会了分别使用卡方检验和方差分析检验。我发现pandas和scipy有API,可以计算分类特征和要预测的标签之间的关系。但这只给出了关于分类变量和要预测的标签的概念 from sklearn.feature_selection import

我正在研究一个包含分类变量和数值变量的数据集。我想找出变量之间的相关性,如果它们的相关性很大,我想去掉其中一个相关特征。我知道pandas
data.corr()
只能用于数值变量和分类变量,只有2个值为0或1。如果我想找到分类变量和一个分类变量之间的相关性,我学会了分别使用卡方检验和方差分析检验。我发现pandas和scipy有API,可以计算分类特征和要预测的标签之间的关系。但这只给出了关于分类变量和要预测的标签的概念

from sklearn.feature_selection import chi2

X = churn_df.drop('Exited',axis=1)
y = churn_df['Exited'] 

chi_scores = chi2(X,y)
print(chi_scores)
是否有卡方检验和方差分析检验的函数或API提供所有分类变量的详尽相关性列表,如pandas
data.corr()
对所有数值变量所做的。基于分类变量中的相关性,我想删除它们