Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 分布式层次聚类_Algorithm_Cluster Analysis_Hierarchical Clustering - Fatal编程技术网

Algorithm 分布式层次聚类

Algorithm 分布式层次聚类,algorithm,cluster-analysis,hierarchical-clustering,Algorithm,Cluster Analysis,Hierarchical Clustering,是否有任何算法可以帮助实现分层聚类? 谷歌的MapReduce只有一个k聚类的例子。在分层集群的情况下,我不确定如何在节点之间分配工作。 我发现的其他资源是: 但是不清楚使用了哪些算法。您可以查看一些使用自组织映射(Kohonen的神经网络方法)的工作。。。上的家伙们已经做了一些关于他们不断增长的层次映射算法的分布式计算的工作 这是一个关于集群问题的边缘问题,因此可能没有帮助,但我想不出更接近的方法;) Clark Olson回顾了几种分层聚类的分布式算法: 奥尔森。并行算法 分层聚类 计算机,

是否有任何算法可以帮助实现分层聚类? 谷歌的MapReduce只有一个k聚类的例子。在分层集群的情况下,我不确定如何在节点之间分配工作。 我发现的其他资源是:
但是不清楚使用了哪些算法。

您可以查看一些使用自组织映射(Kohonen的神经网络方法)的工作。。。上的家伙们已经做了一些关于他们不断增长的层次映射算法的分布式计算的工作


这是一个关于集群问题的边缘问题,因此可能没有帮助,但我想不出更接近的方法;)

Clark Olson回顾了几种分层聚类的分布式算法:

奥尔森。并行算法 分层聚类 计算机,21:1313-13251995

Parunak等人描述了一种算法,其灵感来自蚂蚁如何对巢穴进行排序:

H.Van Dyke Parunak,Richard Rohwer, 西奥多·C·贝尔丁和斯文 布鲁克纳:“动态分散 任何时间分层聚类。”在 过程。第四届工程自组织系统国际研讨会 (ESOA),2006年


首先,您必须决定是自下而上还是自上而下构建层次结构

自下而上称为层次聚集聚类。这里有一个简单的、有充分证明的算法:

分发自底向上的算法很棘手,因为每个分布式进程都需要整个数据集来选择合适的集群。它还需要当前级别的集群列表,这样就不会在同一级别向多个集群添加数据点

自上而下的层次结构称为。是决定如何分割层次结构节点的一个选项。本文研究用于节点分割的K-均值和主方向分割(PDDP)。最后,您只需要将每个父节点拆分为相对平衡的子节点

自上而下的方法更容易分发。在第一次节点拆分之后,创建的每个节点都可以发送到一个分布式进程,以便再次拆分,以此类推。。。每个分布式进程只需要知道它正在拆分的数据集的子集。只有父进程知道完整的数据集

此外,每个拆分都可以并行执行。k-均值的两个例子:


如果有点过时,请查看这篇可读性很强的文章。从那时起,大多数论文都需要付费访问。:-)


如果您使用R,我建议您尝试使用另一个R模块来实现并行性。

您也可以从Newman和Girvan那里看到,他们提出了一种评估网络中社区(以及基于此方法的一组算法)的方法,并测量网络划分为社区的质量(图模块化)

您是否知道任何分布式层次聚集集群?请为Manasi N.Joshi先生在该主题上的工作找到一个答案。