Performance k-means算法会提高数据处理的性能吗？_Performance_Dataset_K Means

Performance k-means算法会提高数据处理的性能吗？

performance

Performance k-means算法会提高数据处理的性能吗？,performance,dataset,k-means,Performance,Dataset,K Means,我试图将k-means算法应用到一个大型数据集，因为k-means的目标是将一组数据点划分为k个簇。我不确定我是否会通过k-means集群重新划分数据集，它是否能够提高数据处理的性能？答案是肯定的。试试这个将原始数据集划分为块；每个块单元称为单元块（UB），包含至少一个图案。我们可以通过简单的计算来确定单元块（CUB）的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB，就可以找到UB中每个模式最近的

我试图将k-means算法应用到一个大型数据集，因为k-means的目标是将一组数据点划分为k个簇。

我不确定我是否会通过k-means集群重新划分数据集，它是否能够提高数据处理的性能？

答案是肯定的。试试这个

将原始数据集划分为块；每个块单元称为单元块（UB），包含至少一个图案。我们可以通过简单的计算来确定单元块（CUB）的质心。所有计算的立方体形成一个表示原始数据集的简化数据集。然后使用缩减后的数据集计算原始数据集的最终质心。我们只需要检查候选簇边界上的每个UB，就可以找到UB中每个模式最近的最终质心。这样，我们可以大大减少计算最终收敛质心的时间。

谢谢！这真的很有帮助！但它是否能够提高处理速度，如对大型数据集的数据查询或计算？在我们的实验中，该算法产生的聚类结果与其他k-means算法相当，但性能要好得多。用你的数据集试试看。