Ruby on rails 关于如何实现flickr';s标签聚类系统?(最好是在轨道上)

Ruby on rails 关于如何实现flickr';s标签聚类系统?(最好是在轨道上),ruby-on-rails,database-design,data-structures,tags,tagging,Ruby On Rails,Database Design,Data Structures,Tags,Tagging,我主要是想讨论一下如何从分散的、非规范化的、完全开放的用户提交的标记开始,通过将它们组合到那些被称为“集群”的语义组中来理解所有这些标记 是需要实际的人来理解人们所使用的标签的真正含义,还是可以简单地通过自动分析标签组合的频率来实现 那种东西。请随意详细阐述:)(另外,如果这一点在其他地方讨论过,我很乐意听到。)阅读本文:。它很好地概述了现有的方法,并描述了标记聚类的算法。(Manning)(特别是第4章)和一本类似于O'Reilly cover clustering algorithms的书。

我主要是想讨论一下如何从分散的、非规范化的、完全开放的用户提交的标记开始,通过将它们组合到那些被称为“集群”的语义组中来理解所有这些标记

是需要实际的人来理解人们所使用的标签的真正含义,还是可以简单地通过自动分析标签组合的频率来实现

那种东西。请随意详细阐述:)(另外,如果这一点在其他地方讨论过,我很乐意听到。)

阅读本文:。它很好地概述了现有的方法,并描述了标记聚类的算法。

(Manning)(特别是第4章)和一本类似于O'Reilly cover clustering algorithms的书。曼宁的书从朴素的SQL方法开始,然后转向K-means、ROCK和DBSCAN。它比只关注标签更通用,但在这种情况下很容易应用。代码是用Java表示的,但很容易适应Ruby(有时比根据您的问题调整Java代码更容易)


第5章介绍了关于构建拓扑的分类,并讨论了贝叶斯算法。

提供的链接不再有效,似乎代表了上述文章。