Speech recognition LBG矢量量化-分裂因子_Speech Recognition_Voice Recognition_Quantization_Feature Clustering

Speech recognition LBG矢量量化-分裂因子

speech-recognition

Speech recognition LBG矢量量化-分裂因子,speech-recognition,voice-recognition,quantization,feature-clustering,Speech Recognition,Voice Recognition,Quantization,Feature Clustering,我目前正在制作一个语音识别程序。在使用LBG（Linde Buzo-Gray）算法生成码本的步骤中，我已经了解到分裂因子ε=0.01（通常）分割因子用于根据公式分割语音特征（训练集）的质心 Yn+=Yn*（1+epison） Yn-=Yn*（1-ε）其中n是要分割的给定码字/质心的索引，Yn是码字此外，在生成码本后，将搜索每个语音特征向量（训练集）的最近邻，并更新质心（基本上是特征聚类）。这样做直到码本的失真小于ε 虽然我的程序似乎运行良好，但我想知道为什么分割因子通常设置为0.01 感谢

我目前正在制作一个语音识别程序。在使用LBG（Linde Buzo-Gray）算法生成码本的步骤中，我已经了解到分裂因子ε=0.01（通常）

分割因子用于根据公式分割语音特征（训练集）的质心

Yn+=Yn*（1+epison）

Yn-=Yn*（1-ε）

其中n是要分割的给定码字/质心的索引，Yn是码字

此外，在生成码本后，将搜索每个语音特征向量（训练集）的最近邻，并更新质心（基本上是特征聚类）。这样做直到码本的失真小于ε

虽然我的程序似乎运行良好，但我想知道为什么分割因子通常设置为0.01

感谢您的帮助。这是我第一次使用码本和矢量量化