Machine learning 识别与mahout群集关联的文档

Machine learning 识别与mahout群集关联的文档,machine-learning,cluster-analysis,mahout,Machine Learning,Cluster Analysis,Mahout,使用ApacheMahout创建文档向量和集群相当容易。执行clusterdump允许用户查看与各个集群关联的术语。但是,如何识别属于每个集群的文档 谢谢我想,对于每个文档,找到它的向量与每个聚类中心的欧几里德距离,并将其分配给最近的聚类 显然,这取决于聚类算法。平方欧几里得仅适用于普通k-均值。谢谢,但是mahout API是否提供了实现这一点的方法/方法集(查找与集群相关的文档)?我在这篇博文中偶然发现了这个片段,我可能应该试试。这将打印每个文档及其相应的集群。这是一个相当容易实现的方法,尤

使用ApacheMahout创建文档向量和集群相当容易。执行clusterdump允许用户查看与各个集群关联的术语。但是,如何识别属于每个集群的文档


谢谢

我想,对于每个文档,找到它的向量与每个聚类中心的欧几里德距离,并将其分配给最近的聚类

显然,这取决于聚类算法。平方欧几里得仅适用于普通k-均值。谢谢,但是mahout API是否提供了实现这一点的方法/方法集(查找与集群相关的文档)?我在这篇博文中偶然发现了这个片段,我可能应该试试。这将打印每个文档及其相应的集群。这是一个相当容易实现的方法,尤其是Mahout。