Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/ms-access/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm Cure算法的缺点_Algorithm_Cluster Analysis - Fatal编程技术网

Algorithm Cure算法的缺点

Algorithm Cure算法的缺点,algorithm,cluster-analysis,Algorithm,Cluster Analysis,我搜索了很多,但找不到Cure算法的缺点。它们对Cure聚类算法有什么限制吗 感谢从关于cure算法的 简短的回答是运行时复杂性 运行时间为O(n^2 log(n)) 空间复杂度为O(n) 对于数据库应用程序,这是一个相当高的运行时复杂性,因此直接将其应用于大型数据库可能会遇到问题 根据维基百科的说法,这种限制可以通过以下方法来缓解 随机抽样:随机抽样支持大数据集。通常,随机样本适合主内存。随机抽样涉及准确性和效率之间的权衡 分区:基本思想是将样本空间划分为p个分区。每个分区包含n/p元素

我搜索了很多,但找不到Cure算法的缺点。它们对Cure聚类算法有什么限制吗


感谢从关于cure算法的

简短的回答是运行时复杂性

  • 运行时间为O(n^2 log(n))
  • 空间复杂度为O(n)
对于数据库应用程序,这是一个相当高的运行时复杂性,因此直接将其应用于大型数据库可能会遇到问题

根据维基百科的说法,这种限制可以通过以下方法来缓解

  • 随机抽样:随机抽样支持大数据集。通常,随机样本适合主内存。随机抽样涉及准确性和效率之间的权衡
  • 分区:基本思想是将样本空间划分为p个分区。每个分区包含n/p元素。第一个过程对每个分区进行部分聚类,直到对于某些常数q,聚类的最终数目减少到n/pq≥ 1.n/q上的第二个集群传递部分地对分区进行集群。对于第二个过程,仅存储代表点,因为合并过程仅需要先前簇的代表点,然后再计算合并簇的代表点。对输入进行分区可以减少执行时间
  • 标记磁盘上的数据:仅给定k个簇的代表点,其余的数据点也将指定给簇。为此,将为每个k簇选择随机选择的代表点的一小部分,并将数据点分配给包含最接近它的代表点的簇