Algorithm 在我的数据上使用Kmeans。

Algorithm 在我的数据上使用Kmeans。,algorithm,cluster-analysis,Algorithm,Cluster Analysis,我想我理解kmeans算法是如何工作的,但是我很难用我的数据将其建模为一种格式 我正在寻找一种方法,根据我的输入获得最相似的游戏 例如: Original_Game has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. Original_Game1 has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. 我想kmeans可以告诉我哪些相

我想我理解kmeans算法是如何工作的,但是我很难用我的数据将其建模为一种格式

我正在寻找一种方法,根据我的输入获得最相似的游戏

例如:

 Original_Game has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes. 
 Original_Game1 has n Similar_Games.  Similar_Games has n Genres, Themes, Tropes.

我想kmeans可以告诉我哪些相似的游戏与原始游戏和原始游戏最相似。但我不知道如何在二维图上组织这些数据,如果我不清楚,请告诉我

您只能对以下数据使用k-means:

  • 可以合理地用数字表示
  • 不是过度离散(不要在二进制向量上运行k-means!)
  • 其中所有尺寸的含义大致相同(即x轴上1 cm,y轴上约1 cm)
  • 在那里你可以计算平均值
  • 如果均值减小方差,则它可能不会收敛
K-means很容易理解,但不能处理任意数据


例如,您可以通过使用k-medoid/围绕medoid的分区(PAM)来减少这些限制。这是一个密切相关的算法,它消除了大多数这些限制,但代价通常要慢得多。

你能计算出平均值吗?如果你不能计算数据的合理均值,你就不能使用k均值。我想我应该结束这个问题。这有帮助,但我只是走了另一条路。但最终我需要做更多的工作。很抱歉。