Speech recognition LBG矢量量化-分裂因子

Speech recognition LBG矢量量化-分裂因子,speech-recognition,voice-recognition,quantization,feature-clustering,Speech Recognition,Voice Recognition,Quantization,Feature Clustering,我目前正在制作一个语音识别程序。在使用LBG(Linde Buzo-Gray)算法生成码本的步骤中,我已经了解到分裂因子ε=0.01(通常) 分割因子用于根据公式分割语音特征(训练集)的质心 Yn+=Yn*(1+epison) Yn-=Yn*(1-ε) 其中n是要分割的给定码字/质心的索引,Yn是码字 此外,在生成码本后,将搜索每个语音特征向量(训练集)的最近邻,并更新质心(基本上是特征聚类)。这样做直到码本的失真小于ε 虽然我的程序似乎运行良好,但我想知道为什么分割因子通常设置为0.01 感谢

我目前正在制作一个语音识别程序。在使用LBG(Linde Buzo-Gray)算法生成码本的步骤中,我已经了解到分裂因子ε=0.01(通常)

分割因子用于根据公式分割语音特征(训练集)的质心

Yn+=Yn*(1+epison)

Yn-=Yn*(1-ε)

其中n是要分割的给定码字/质心的索引,Yn是码字

此外,在生成码本后,将搜索每个语音特征向量(训练集)的最近邻,并更新质心(基本上是特征聚类)。这样做直到码本的失真小于ε

虽然我的程序似乎运行良好,但我想知道为什么分割因子通常设置为0.01

感谢您的帮助。这是我第一次使用码本和矢量量化