Algorithm 在我的数据上使用Kmeans。
我想我理解kmeans算法是如何工作的,但是我很难用我的数据将其建模为一种格式 我正在寻找一种方法,根据我的输入获得最相似的游戏 例如:Algorithm 在我的数据上使用Kmeans。,algorithm,cluster-analysis,Algorithm,Cluster Analysis,我想我理解kmeans算法是如何工作的,但是我很难用我的数据将其建模为一种格式 我正在寻找一种方法,根据我的输入获得最相似的游戏 例如: Original_Game has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. Original_Game1 has n Similar_Games. Similar_Games has n Genres, Themes, Tropes. 我想kmeans可以告诉我哪些相
Original_Game has n Similar_Games. Similar_Games has n Genres, Themes, Tropes.
Original_Game1 has n Similar_Games. Similar_Games has n Genres, Themes, Tropes.
我想kmeans可以告诉我哪些相似的游戏与原始游戏和原始游戏最相似。但我不知道如何在二维图上组织这些数据,如果我不清楚,请告诉我 您只能对以下数据使用k-means:
- 可以合理地用数字表示
- 不是过度离散(不要在二进制向量上运行k-means!)
- 其中所有尺寸的含义大致相同(即x轴上1 cm,y轴上约1 cm)
- 在那里你可以计算平均值
- 如果均值减小方差,则它可能不会收敛
例如,您可以通过使用k-medoid/围绕medoid的分区(PAM)来减少这些限制。这是一个密切相关的算法,它消除了大多数这些限制,但代价通常要慢得多。你能计算出平均值吗?如果你不能计算数据的合理均值,你就不能使用k均值。我想我应该结束这个问题。这有帮助,但我只是走了另一条路。但最终我需要做更多的工作。很抱歉。