R中相异矩阵的聚类

R中相异矩阵的聚类,r,cluster-analysis,k-means,R,Cluster Analysis,K Means,我目前正试图了解无经验的机器学习,即集群,但有点困惑 首先,这就是为什么我需要一个集群算法。我计算了一个相异矩阵nxn,其中比较了二叉树的(dis)相似性。这意味着对于条目Ni,i,值为零(表示对角线为零),对于条目Ni,j,值为≥ 0这是一个包含100 x 100个元素的矩阵,也就是说,我有100个二叉树,我将它们相互比较。该矩阵在R之外计算。我的矩阵中的距离是树编辑距离,满足三角形不等式 哪种聚类算法实际上只允许我使用这些信息?我很确定我可以使用分层聚类,但是我如何使用这个矩阵在R中执行k-

我目前正试图了解无经验的机器学习,即集群,但有点困惑

首先,这就是为什么我需要一个集群算法。我计算了一个相异矩阵nxn,其中比较了二叉树的(dis)相似性。这意味着对于条目Ni,i,值为零(表示对角线为零),对于条目Ni,j,值为≥ 0这是一个包含100 x 100个元素的矩阵,也就是说,我有100个二叉树,我将它们相互比较。该矩阵在R之外计算。我的矩阵中的距离是树编辑距离,满足三角形不等式


哪种聚类算法实际上只允许我使用这些信息?我很确定我可以使用分层聚类,但是我如何使用这个矩阵在R中执行k-means-order-PAM聚类呢

你不能使用k-means。因为它需要计算平均值,以及与平均值的距离。那对树不起作用

HAC、PAM和DBSCAN都可以。DBSCAN是这三种方法中最具可扩展性的一种,但如果您有足够的数据,它也会工作得更好—您的样本可能太小,无法满足这一要求。所以我会用醋酸