Algorithm 在我的数据上使用Kmeans。_Algorithm_Cluster Analysis

Algorithm 在我的数据上使用Kmeans。

algorithm

Algorithm 在我的数据上使用Kmeans。,algorithm,cluster-analysis,Algorithm,Cluster Analysis,我想我理解kmeans算法是如何工作的，但是我很难用我的数据将其建模为一种格式我正在寻找一种方法，根据我的输入获得最相似的游戏例如： Original_Game has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. Original_Game1 has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. 我想kmeans可以告诉我哪些相

我想我理解kmeans算法是如何工作的，但是我很难用我的数据将其建模为一种格式

我正在寻找一种方法，根据我的输入获得最相似的游戏

例如：

 Original_Game has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes. 
 Original_Game1 has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes.

我想kmeans可以告诉我哪些相似的游戏与原始游戏和原始游戏最相似。但我不知道如何在二维图上组织这些数据，如果我不清楚，请告诉我

您只能对以下数据使用k-means：

可以合理地用数字表示
不是过度离散（不要在二进制向量上运行k-means！）
其中所有尺寸的含义大致相同（即x轴上1 cm，y轴上约1 cm）
在那里你可以计算平均值
如果均值减小方差，则它可能不会收敛

K-means很容易理解，但不能处理任意数据

例如，您可以通过使用k-medoid/围绕medoid的分区（PAM）来减少这些限制。这是一个密切相关的算法，它消除了大多数这些限制，但代价通常要慢得多。

你能计算出平均值吗？如果你不能计算数据的合理均值，你就不能使用k均值。我想我应该结束这个问题。这有帮助，但我只是走了另一条路。但最终我需要做更多的工作。很抱歉。