Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/345.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Performance k-means算法会提高数据处理的性能吗?_Performance_Dataset_K Means - Fatal编程技术网

Performance k-means算法会提高数据处理的性能吗?

Performance k-means算法会提高数据处理的性能吗?,performance,dataset,k-means,Performance,Dataset,K Means,我试图将k-means算法应用到一个大型数据集,因为k-means的目标是将一组数据点划分为k个簇。 我不确定我是否会通过k-means集群重新划分数据集,它是否能够提高数据处理的性能?答案是肯定的。试试这个 将原始数据集划分为块;每个块单元称为单元块(UB),包含至少一个图案。我们可以通过简单的计算来确定单元块(CUB)的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB,就可以找到UB中每个模式最近的

我试图将k-means算法应用到一个大型数据集,因为k-means的目标是将一组数据点划分为k个簇。
我不确定我是否会通过k-means集群重新划分数据集,它是否能够提高数据处理的性能?

答案是肯定的。试试这个


将原始数据集划分为块;每个块单元称为单元块(UB),包含至少一个图案。我们可以通过简单的计算来确定单元块(CUB)的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB,就可以找到UB中每个模式最近的最终质心。这样,我们可以大大减少计算最终收敛质心的时间。

谢谢!这真的很有帮助!但它是否能够提高处理速度,如对大型数据集的数据查询或计算?在我们的实验中,该算法产生的聚类结果与其他k-means算法相当,但性能要好得多。用你的数据集试试看。