Machine learning K-均值中具有相同值的多个对象

Machine learning K-均值中具有相同值的多个对象,machine-learning,cluster-analysis,k-means,Machine Learning,Cluster Analysis,K Means,我的数据有问题 这是我的医疗数据库 (名称、值1、值2、值3、值4) 约翰10,20,30,40 约翰9、12、21、33 诺亚8,22,18,10 安娜9,19,29,32 克拉克11,4,17,20 在医疗保健数据库中,一个人可能会生病两次、三次或更多,正如您在我的数据库中看到的示例中所示,有两个jhon有两个记录,因为他病了两次 我使用k-means的目的是获得两个集群(集群1:group1,集群2:group2)及其成员 我希望得到如下输出: 第一组:约翰,克拉克 第二组:诺亚、安娜、约

我的数据有问题

这是我的医疗数据库

(名称、值1、值2、值3、值4)

约翰10,20,30,40

约翰9、12、21、33

诺亚8,22,18,10

安娜9,19,29,32

克拉克11,4,17,20

在医疗保健数据库中,一个人可能会生病两次、三次或更多,正如您在我的数据库中看到的示例中所示,有两个jhon有两个记录,因为他病了两次

我使用k-means的目的是获得两个集群(集群1:group1,集群2:group2)及其成员

我希望得到如下输出:

第一组:约翰,克拉克

第二组:诺亚、安娜、约翰


你看,有两个jhon's,一个成员可以是组1和组2,所以我如何解决这个问题???

K-means通过两个步骤之间的迭代工作。你基本上是在

  • 假设您知道实例到集群的映射,并计算集群中心

  • 假设您知道集群中心,将实例分配给集群

  • 因此,如果您有限制,例如,所有jhon(sic)应该属于同一个集群,您可以将其纳入步骤2:您需要找到最有可能同时分配所有jhon(sic)的集群


    详情请参见。

    Ami先生,我在第3.1节中看到,在第二步中,对于D中的每个点,都有一个逐步的COP Kmeans,将其分配给最近的集群Cj,使其违反约束这是您的意思吗
    您需要找到最有可能同时分配所有约束的集群
    ?但我仍然不明白什么是违反约束(di,Cj,Con=,Con!=)是算法还是其他?