Performance k-means算法会提高数据处理的性能吗?
我试图将k-means算法应用到一个大型数据集,因为k-means的目标是将一组数据点划分为k个簇。Performance k-means算法会提高数据处理的性能吗?,performance,dataset,k-means,Performance,Dataset,K Means,我试图将k-means算法应用到一个大型数据集,因为k-means的目标是将一组数据点划分为k个簇。 我不确定我是否会通过k-means集群重新划分数据集,它是否能够提高数据处理的性能?答案是肯定的。试试这个 将原始数据集划分为块;每个块单元称为单元块(UB),包含至少一个图案。我们可以通过简单的计算来确定单元块(CUB)的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB,就可以找到UB中每个模式最近的
我不确定我是否会通过k-means集群重新划分数据集,它是否能够提高数据处理的性能?答案是肯定的。试试这个
将原始数据集划分为块;每个块单元称为单元块(UB),包含至少一个图案。我们可以通过简单的计算来确定单元块(CUB)的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB,就可以找到UB中每个模式最近的最终质心。这样,我们可以大大减少计算最终收敛质心的时间。谢谢!这真的很有帮助!但它是否能够提高处理速度,如对大型数据集的数据查询或计算?在我们的实验中,该算法产生的聚类结果与其他k-means算法相当,但性能要好得多。用你的数据集试试看。