Machine learning K-均值中具有相同值的多个对象_Machine Learning_Cluster Analysis_K Means

Machine learning K-均值中具有相同值的多个对象

machine-learning

Machine learning K-均值中具有相同值的多个对象,machine-learning,cluster-analysis,k-means,Machine Learning,Cluster Analysis,K Means,我的数据有问题这是我的医疗数据库（名称、值1、值2、值3、值4）约翰10,20,30,40 约翰9、12、21、33 诺亚8,22,18,10 安娜9,19,29,32 克拉克11,4,17,20 在医疗保健数据库中，一个人可能会生病两次、三次或更多，正如您在我的数据库中看到的示例中所示，有两个jhon有两个记录，因为他病了两次我使用k-means的目的是获得两个集群（集群1:group1，集群2:group2）及其成员我希望得到如下输出：第一组：约翰，克拉克第二组：诺亚、安娜、约

我的数据有问题

这是我的医疗数据库

（名称、值1、值2、值3、值4）

约翰10,20,30,40

约翰9、12、21、33

诺亚8,22,18,10

安娜9,19,29,32

克拉克11,4,17,20

在医疗保健数据库中，一个人可能会生病两次、三次或更多，正如您在我的数据库中看到的示例中所示，有两个jhon有两个记录，因为他病了两次

我使用k-means的目的是获得两个集群（集群1:group1，集群2:group2）及其成员

我希望得到如下输出：

第一组：约翰，克拉克

第二组：诺亚、安娜、约翰

你看，有两个jhon's，一个成员可以是组1和组2，所以我如何解决这个问题？？？

K-means通过两个步骤之间的迭代工作。你基本上是在

假设您知道实例到集群的映射，并计算集群中心

假设您知道集群中心，将实例分配给集群

因此，如果您有限制，例如，所有jhon（sic）应该属于同一个集群，您可以将其纳入步骤2：您需要找到最有可能同时分配所有jhon（sic）的集群

详情请参见。

Ami先生，我在第3.1节中看到，在第二步中，对于D中的每个点，都有一个逐步的COP Kmeans，将其分配给最近的集群Cj，使其违反约束这是您的意思吗

您需要找到最有可能同时分配所有约束的集群

？但我仍然不明白什么是违反约束（di，Cj，Con=，Con！=）是算法还是其他？