Machine learning 在K-Means聚类算法(sklearn)中,如何将欧几里德距离覆盖到某个距离

Machine learning 在K-Means聚类算法(sklearn)中,如何将欧几里德距离覆盖到某个距离,machine-learning,scikit-learn,k-means,euclidean-distance,wmd,Machine Learning,Scikit Learn,K Means,Euclidean Distance,Wmd,我有一些文档集,我只想对相关文档进行分组。目前我正在使用google的新闻向量文件(GoogleNews-vectors-negative300.bin),通过这个向量文件我得到了向量,我使用WMD(Word Mover Distance)算法来获得两个文档之间的距离。现在我想把它和K均值聚类结合起来,基本上我想覆盖KMeans中的距离计算函数。我该怎么做?欢迎提出任何建议。提前谢谢 虽然理论上可以用其他距离度量实现k-均值,但不建议这样做-您的算法可能会停止收敛。更详细的讨论可以在上找到,例如

我有一些文档集,我只想对相关文档进行分组。目前我正在使用google的新闻向量文件(GoogleNews-vectors-negative300.bin),通过这个向量文件我得到了向量,我使用WMD(Word Mover Distance)算法来获得两个文档之间的距离。现在我想把它和K均值聚类结合起来,基本上我想覆盖KMeans中的距离计算函数。我该怎么做?欢迎提出任何建议。提前谢谢

虽然理论上可以用其他距离度量实现k-均值,但不建议这样做-您的算法可能会停止收敛。更详细的讨论可以在上找到,例如。这就是为什么scikit learn没有其他距离度量

我建议使用分层聚类,在这里可以插入任意距离函数