Machine learning K均值聚类和矢量量化之间的区别是什么?

Machine learning K均值聚类和矢量量化之间的区别是什么?,machine-learning,computer-vision,hidden-markov-models,Machine Learning,Computer Vision,Hidden Markov Models,K均值聚类和矢量量化之间的区别是什么 他们似乎非常相似 我正在处理隐马尔可夫模型,我需要从特征向量中提取符号 为了提取符号,我是做矢量量化还是k-均值聚类?据我理解,k-均值是一种矢量量化。k-均值算法是著名的“Lloyd I”量化算法对经验分布情况的特殊化。(比照劳埃德) Lloyd I算法被证明可以产生一个二次失真减小的量化器序列。然而,除了一维对数凹分布的特殊情况外,它并不总是收敛到二次最优量化器。(量化误差存在局部极小值,特别是在处理经验分布(即聚类问题)时。) 一种(总是)向最优量化器

K均值聚类和矢量量化之间的区别是什么

他们似乎非常相似

我正在处理隐马尔可夫模型,我需要从特征向量中提取符号


为了提取符号,我是做矢量量化还是k-均值聚类?

据我理解,k-均值是一种矢量量化。

k-均值算法是著名的“Lloyd I”量化算法对经验分布情况的特殊化。(比照劳埃德)

Lloyd I算法被证明可以产生一个二次失真减小的量化器序列。然而,除了一维对数凹分布的特殊情况外,它并不总是收敛到二次最优量化器。(量化误差存在局部极小值,特别是在处理经验分布(即聚类问题)时。)

一种(总是)向最优量化器收敛的方法是所谓的CLVQ算法,它也推广到更一般的L^p量化问题。它是一种随机梯度法。(参见Pagès)


还有一些基于遗传算法的方法。(参见Hamida等人)和/或一维情况下收敛更快的经典优化程序(Pagès,Printems)。

准确地说。K-均值聚类是执行矢量量化的一种方法。通过K-means找到的质心(使用信息论术语)是代码本的符号或码字。要解码向量,请将向量指定给它最接近的质心(或码字)。也许您应该通过解释什么是向量量化来解释为什么k-means是一种向量量化。