分类数据的Python相关矩阵

分类数据的Python相关矩阵,python,correlation,categorical-data,Python,Correlation,Categorical Data,我有一个慈善机构的一些数据,其中包含有人捐赠的金额和一些关于捐赠者的信息,如下所示 性别年龄国家捐赠金额 F 25英国15 F 65法国80 M 55德国54 F 41英国3 M 74法国99 我想找出哪些列与捐赠金额最密切相关,以便我可以进一步调查它们。例如,与其他国家相比,某些国家捐赠很多,因此最好针对它们。使用pandas.corr()函数很容易做到这一点,但是这不适用于诸如性别之类的分类数据,而只适用于诸如年龄之类的数字数据 有人知道我能做这件事的方法吗 我读过关于使用pandas.ge

我有一个慈善机构的一些数据,其中包含有人捐赠的金额和一些关于捐赠者的信息,如下所示

性别年龄国家捐赠金额

F 25英国15

F 65法国80

M 55德国54

F 41英国3

M 74法国99

我想找出哪些列与捐赠金额最密切相关,以便我可以进一步调查它们。例如,与其他国家相比,某些国家捐赠很多,因此最好针对它们。使用pandas.corr()函数很容易做到这一点,但是这不适用于诸如性别之类的分类数据,而只适用于诸如年龄之类的数字数据

有人知道我能做这件事的方法吗

我读过关于使用pandas.get_dummies()将分类变量转换为伪/指示符变量的内容。问题是我有相当多的专栏,其中有几个有超过40个不同的人口统计类别,所以这是非常大的,非常快,很难解释(至少我一直这样做!)

我还发现这篇文章说,您可以使用spearmanr,但在其他地方也看到,您不应该将spearmanr用于分类数据。pandas.corr(method=spearman)方法对分类数据也不起作用。 ()

这是我的第一篇帖子,如果我没有很好地解释我自己,我深表歉意!请让我知道,我会纠正任何需要的