矢量量化中的马氏距离与欧几里德距离 我在 opencv 中使用C++做了强> k均值聚类/,并且有12个聚类中心(每个都在200个维度)。

矢量量化中的马氏距离与欧几里德距离 我在 opencv 中使用C++做了强> k均值聚类/,并且有12个聚类中心(每个都在200个维度)。,c++,opencv,computer-vision,cluster-analysis,C++,Opencv,Computer Vision,Cluster Analysis,现在,我有一组200维的点,我试图找到最近的簇(矢量量化) 哪种距离比另一种(马氏距离或欧几里德距离)更可取?目前我使用的是欧几里德距离。如果不知道上下文,这是不可能回答的。没有好的或坏的指标,每一个指标都更适合于一类特定的问题。是一个有效的指标。我可以补充一项一般性声明: 对于马氏距离,您需要能够正确估计每个簇的协方差矩阵。对于200维,您可以期望对协方差矩阵簇进行合理估计的唯一方法是使用数百到数千个数据点。再加上你拥有的12个集群,你很容易需要数万个数据点来合理使用马氏距离 除此之外:试试欧

现在,我有一组200维的,我试图找到最近的簇(矢量量化


哪种距离比另一种(马氏距离或欧几里德距离)更可取?目前我使用的是欧几里德距离。

如果不知道上下文,这是不可能回答的。没有好的或坏的指标,每一个指标都更适合于一类特定的问题。

是一个有效的指标。我可以补充一项一般性声明:

对于马氏距离,您需要能够正确估计每个簇的协方差矩阵。对于200维,您可以期望对协方差矩阵簇进行合理估计的唯一方法是使用数百到数千个数据点。再加上你拥有的12个集群,你很容易需要数万个数据点来合理使用马氏距离

除此之外:试试欧几里德距离对你的作用。如果结果合理,就坚持下去,否则就试试马哈拉诺比斯


最后,您可能会在上找到更多关于此主题的知识渊博的人。

您可能正在编写一个程序,但您的问题与编程无关。它涉及特定领域的知识。