Audio Sphinx的理想音频级别是什么？_Audio_Cmusphinx

Audio Sphinx的理想音频级别是什么？

audio

Audio Sphinx的理想音频级别是什么？,audio,cmusphinx,Audio,Cmusphinx,在我的系统上，使用USB麦克风，我发现CMU Sphinx最适合的音频电平大约是最大值的20%。这给了我75%的语音识别准确率。如果我用数字放大，我的识别准确率会差得多（25%）。为什么会这样？Sphinx的推荐音频级别是多少？[我还使用16000个采样/秒，16位。]pocketsphinx解码器使用通道振幅标准化。初始规范化值被配置为模型内部20%的音频级别（-feat.params中的cmninit参数）。但是，级别会随着解码而更新，因此它仅对第一次说话有效。若你们在连续模式下正确解码，那

在我的系统上，使用USB麦克风，我发现CMU Sphinx最适合的音频电平大约是最大值的20%。这给了我75%的语音识别准确率。如果我用数字放大，我的识别准确率会差得多（25%）。为什么会这样？Sphinx的推荐音频级别是多少？[我还使用16000个采样/秒，16位。]

pocketsphinx解码器使用通道振幅标准化。初始规范化值被配置为模型内部20%的音频级别（-feat.params中的cmninit参数）。但是，级别会随着解码而更新，因此它仅对第一次说话有效。若你们在连续模式下正确解码，那个么电平应该无关紧要。不要为每一句话重新启动识别器，让它适应噪音和音频水平