Python 为什么K-均值聚类的分类精度会随着训练数据的增加而降低?

Python 为什么K-均值聚类的分类精度会随着训练数据的增加而降低?,python,scikit-learn,cluster-analysis,k-means,Python,Scikit Learn,Cluster Analysis,K Means,我想对视频中的动作进行分类。为此,将K-均值聚类应用于光流点以生成码本 当k=200时,准确度最初为85%。添加训练数据后,准确率为50%。如果k=400,则准确率将回到85% 如何为我的训练数据自动优化k的值?KMeans聚类将降低MSE,最佳聚类数的答案是“视情况而定”。您可以使用弯头方法来找到最佳的簇数。这里有一个您可以浏览以了解更多详细信息。欢迎使用机器学习。不幸的是,没有一个答案适用于所有问题。K-means在某些数据上相当不稳定。运行几次,你可以得到各种各样的结果——这通常表明它们都

我想对视频中的动作进行分类。为此,将K-均值聚类应用于光流点以生成码本

k=200
时,准确度最初为85%。添加训练数据后,准确率为50%。如果
k=400
,则准确率将回到85%


如何为我的训练数据自动优化
k
的值?

KMeans聚类将降低MSE,最佳聚类数的答案是“视情况而定”。您可以使用弯头方法来找到最佳的簇数。这里有一个您可以浏览以了解更多详细信息。

欢迎使用机器学习。不幸的是,没有一个答案适用于所有问题。K-means在某些数据上相当不稳定。运行几次,你可以得到各种各样的结果——这通常表明它们都不好。因此,您可能还存在一些评估问题。“准确性”在聚类中不常用。k-means聚类用于创建码本。上述精度是最终分类器的精度。我尝试了肘部方法,仅绘制5个不同的k值就花费了数小时。是否有任何方法可以缩短计算时间?不幸的是,没有。我认为所有方法都需要时间。你可以尝试平均轮廓和差距统计。平均轮廓分数曲线在+1和-1区域都有尖峰,我无法解释它。我试试差距统计