Audio Sphinx的理想音频级别是什么?

Audio Sphinx的理想音频级别是什么?,audio,cmusphinx,Audio,Cmusphinx,在我的系统上,使用USB麦克风,我发现CMU Sphinx最适合的音频电平大约是最大值的20%。这给了我75%的语音识别准确率。如果我用数字放大,我的识别准确率会差得多(25%)。为什么会这样?Sphinx的推荐音频级别是多少?[我还使用16000个采样/秒,16位。]pocketsphinx解码器使用通道振幅标准化。初始规范化值被配置为模型内部20%的音频级别(-feat.params中的cmninit参数)。但是,级别会随着解码而更新,因此它仅对第一次说话有效。若你们在连续模式下正确解码,那

在我的系统上,使用USB麦克风,我发现CMU Sphinx最适合的音频电平大约是最大值的20%。这给了我75%的语音识别准确率。如果我用数字放大,我的识别准确率会差得多(25%)。为什么会这样?Sphinx的推荐音频级别是多少?[我还使用16000个采样/秒,16位。]

pocketsphinx解码器使用通道振幅标准化。初始规范化值被配置为模型内部20%的音频级别(-feat.params中的cmninit参数)。但是,级别会随着解码而更新,因此它仅对第一次说话有效。若你们在连续模式下正确解码,那个么电平应该无关紧要。不要为每一句话重新启动识别器,让它适应噪音和音频水平