python中数字和二进制数据的分层聚类-距离度量

python中数字和二进制数据的分层聚类-距离度量,python,scipy,binary,distance,hierarchical-clustering,Python,Scipy,Binary,Distance,Hierarchical Clustering,我需要使用seaborn中提出的分层聚类方法对一个包含数字和二进制数据(一个热编码的分类数据)的数据集进行聚类。 但是,我不确定应该使用哪种距离度量。我知道它们中的大多数都不能处理二进制数据,但最好的选择是什么 我看到有人建议使用高尔距离,但没有scipy实现。因此,我不能在sns.clustermap中使用它 我真的很感激任何建议 嗨,欢迎。请将您迄今为止尝试过的代码以及遇到的问题发布到哪里

我需要使用seaborn中提出的分层聚类方法对一个包含数字和二进制数据(一个热编码的分类数据)的数据集进行聚类。 但是,我不确定应该使用哪种距离度量。我知道它们中的大多数都不能处理二进制数据,但最好的选择是什么

我看到有人建议使用高尔距离,但没有scipy实现。因此,我不能在sns.clustermap中使用它


我真的很感激任何建议

嗨,欢迎。请将您迄今为止尝试过的代码以及遇到的问题发布到哪里