在Python编程中使用numpy和nltk或CLUTO对单词进行聚类

在Python编程中使用numpy和nltk或CLUTO对单词进行聚类,python,cluster-analysis,nltk,cluto,Python,Cluster Analysis,Nltk,Cluto,我想把一些词聚在一起。 我的部分数据如下(这只是一个例子) 数字越大,表示两个单词之间的相似度越高。 基于这种格式的数据,我想做一个集群(例如,(猫,狗),(马),(鸵鸟)共3个集群) 起初,我试着用CLUTO。。。如下图所示制作一些簇和(非常漂亮的)图形。 但是我不能。。。我已经看过手册了,但不是那么容易理解。 所以,我尝试在nltk中使用一些集群库,比如k-means等等。但我不知道如何创建上面这样的图。(我还必须根据输入的数据进行一些聚类)您呈现的图像是一张图片。与“典型”聚类分析不同,

我想把一些词聚在一起。
我的部分数据如下(这只是一个例子)

数字越大,表示两个单词之间的相似度越高。 基于这种格式的数据,我想做一个集群(例如,(猫,狗),(马),(鸵鸟)共3个集群)

起初,我试着用CLUTO。。。如下图所示制作一些簇和(非常漂亮的)图形。

但是我不能。。。我已经看过手册了,但不是那么容易理解。
所以,我尝试在nltk中使用一些集群库,比如k-means等等。但我不知道如何创建上面这样的图。(我还必须根据输入的数据进行一些聚类)

您呈现的图像是一张图片。与“典型”聚类分析不同,它显示的不是一种对数据进行聚类的方法,而是对所有可能数量的聚类进行聚类的所有可能方法。通过计算层次与层次图像中任意水平线的交点,可以得到一个“簇集”

算法OTOH取决于您提供所需的集群数量,因此无法从中生成层次结构。NLTK为分层聚类分析提供了工具


在决定想要什么样的输出之前,您可能应该先熟悉一下。你是在要求别人给你辅导吗?我建议你再试试医生,然后带着一些真实和具体的疑问回来。
    cat dog horse ostrich 
cat  8   2.3  3.4  4.7
dog  7   8    3   2.4
horse 3.4 2.5 8  1.5
ostrich 3.4 3.2 4.4 8