Python 为什么K-均值聚类的分类精度会随着训练数据的增加而降低？_Python_Scikit Learn_Cluster Analysis_K Means

Python 为什么K-均值聚类的分类精度会随着训练数据的增加而降低？

python scikit-learn

Python 为什么K-均值聚类的分类精度会随着训练数据的增加而降低？,python,scikit-learn,cluster-analysis,k-means,Python,Scikit Learn,Cluster Analysis,K Means,我想对视频中的动作进行分类。为此，将K-均值聚类应用于光流点以生成码本当k=200时，准确度最初为85%。添加训练数据后，准确率为50%。如果k=400，则准确率将回到85% 如何为我的训练数据自动优化k的值？KMeans聚类将降低MSE，最佳聚类数的答案是“视情况而定”。您可以使用弯头方法来找到最佳的簇数。这里有一个您可以浏览以了解更多详细信息。欢迎使用机器学习。不幸的是，没有一个答案适用于所有问题。K-means在某些数据上相当不稳定。运行几次，你可以得到各种各样的结果——这通常表明它们都

我想对视频中的动作进行分类。为此，将K-均值聚类应用于光流点以生成码本

当

k=200

时，准确度最初为85%。添加训练数据后，准确率为50%。如果

k=400

，则准确率将回到85%

如何为我的训练数据自动优化

的值？

KMeans聚类将降低MSE，最佳聚类数的答案是“视情况而定”。您可以使用弯头方法来找到最佳的簇数。这里有一个您可以浏览以了解更多详细信息。

欢迎使用机器学习。不幸的是，没有一个答案适用于所有问题。K-means在某些数据上相当不稳定。运行几次，你可以得到各种各样的结果——这通常表明它们都不好。因此，您可能还存在一些评估问题。“准确性”在聚类中不常用。k-means聚类用于创建码本。上述精度是最终分类器的精度。我尝试了肘部方法，仅绘制5个不同的k值就花费了数小时。是否有任何方法可以缩短计算时间？不幸的是，没有。我认为所有方法都需要时间。你可以尝试平均轮廓和差距统计。平均轮廓分数曲线在+1和-1区域都有尖峰，我无法解释它。我试试差距统计