Python 如何获得分类变量和连续变量之间的相关性?

Python 如何获得分类变量和连续变量之间的相关性?,python,numpy,correlation,categorical-data,Python,Numpy,Correlation,Categorical Data,我想得到分类变量和连续变量之间的相关性 我使用np.corrcoef来研究stackoverflow问题,并尝试做同样的事情。然而,相关性是通过拟合数据来查看x和y之间的关系。我想知道在用虚拟变量替换x分类变量之后,推导y数值变量的相关性是否有意义 例如,一个名为“火灾类型”的分类变量有四类,a类、B类、C类、D类,y是一个名为“消防员人力”的数字变量,使用np.CORRCOF 因此,a类与消防员人力之间的相关系数为-0.2 在分析这些数据时,它是否产生了有意义的结果?点双列相关是能够反映连续特

我想得到分类变量和连续变量之间的相关性

我使用np.corrcoef来研究stackoverflow问题,并尝试做同样的事情。然而,相关性是通过拟合数据来查看x和y之间的关系。我想知道在用虚拟变量替换x分类变量之后,推导y数值变量的相关性是否有意义

例如,一个名为“火灾类型”的分类变量有四类,a类、B类、C类、D类,y是一个名为“消防员人力”的数字变量,使用np.CORRCOF

因此,a类与消防员人力之间的相关系数为-0.2


在分析这些数据时,它是否产生了有意义的结果?

点双列相关是能够反映连续特征和分类特征之间关系的相关

在python中,您可以使用:

from scipy import stats
stats.pointbiserialr(x, y)