Algorithm 具有N个节点和K个配送中心的聚类

Algorithm 具有N个节点和K个配送中心的聚类,algorithm,optimization,cluster-analysis,load-balancing,heuristics,Algorithm,Optimization,Cluster Analysis,Load Balancing,Heuristics,我有一个由N个节点和K个配送中心组成的数据集。如果我知道它们各自的x,y坐标 我可以使用什么算法对这些节点进行集群以保持平衡 在距离节点中心和指定给节点的节点数之间 中心 例如,我可以使用作为标准,将节点分配到最近的配送中心,但这可能会产生具有多个节点的配送中心,我希望避免这种情况。有什么帮助吗?将其表述为一个优化问题 例如,平均距离,以及分配给同一K的N太多时的惩罚因子 然后使用标准的优化技术来找到解决方案 不要期望任何现成的东西支持像您这样的模糊约束。你必须决定什么是好的解决方案,然后让优化

我有一个由N个节点和K个配送中心组成的数据集。如果我知道它们各自的x,y坐标

我可以使用什么算法对这些节点进行集群以保持平衡 在距离节点中心和指定给节点的节点数之间 中心


例如,我可以使用作为标准,将节点分配到最近的配送中心,但这可能会产生具有多个节点的配送中心,我希望避免这种情况。有什么帮助吗?

将其表述为一个优化问题

例如,平均距离,以及分配给同一K的N太多时的惩罚因子

然后使用标准的优化技术来找到解决方案


不要期望任何现成的东西支持像您这样的模糊约束。你必须决定什么是好的解决方案,然后让优化器搜索好的解决方案。

可以写成MIP混合整数规划问题。类似于一个分配问题,与靠近仓库相比,节点分布良好更重要吗?考虑一个有2个仓库的设计实例,N-1个节点靠近仓库A,只有1个节点靠近B。什么时候我们将节点连接到B?你是对的,这是第一个技术,而且很好,但是我正在试验用更快的方法来牺牲最好的答案,因为MIP对我来说不再是一个选择了。谢谢你的建议这就是重点拉里,我正在寻找最佳答案的近似值。很高兴看到不同的方法如何解决这种情况,因为这是一个极端的情况。有时它会选择最小距离而不是平衡距离。如果在您的情况下,算法将N-1个节点与A匹配,并且对我来说只有一个节点与B匹配是好的,或者如果它尝试平衡一些节点也是好的。假设我正在搜索一个接近我中心的K-means。提前感谢。你必须先定义平衡的含义,然后才能想出实现平衡的算法。与每个配送中心的节点数量大致相等相比,您必须决定与节点的接近程度有多重要。也许您希望能够对其进行调整,以便设置相对重要性并使算法尽可能接近。但是如果没有更详细的要求,就很难给你一个有意义的答案。