Audio 音频语言识别_Audio_Cmusphinx

Audio 音频语言识别

audio

Audio 音频语言识别,audio,cmusphinx,Audio,Cmusphinx,我正在寻找一个开源库来检测音频文件（如wav文件）中使用的口语我试过CMU sphinx，但不知道如何使用它进行语言检测？有人能帮忙吗？您可以在所有电话解码模式下尝试CMU sphinx。为您希望识别的语言培训模型。如果假设你愿意学习另一个工具包，你应该考虑Kaldi[]。这是一个开源的语音识别工具包，主干中有一个说话人识别系统（使用与语言识别系统类似的模型），沙盒语言id中有一个实验性语言识别设置，您可以使用svn开关^/sandbox/language_id切换到LID沙盒。LID示例

我正在寻找一个开源库来检测音频文件（如wav文件）中使用的口语

我试过CMU sphinx，但不知道如何使用它进行语言检测？有人能帮忙吗？

您可以在所有电话解码模式下尝试CMU sphinx。为您希望识别的语言培训模型。

如果假设你愿意学习另一个工具包，你应该考虑Kaldi[]。这是一个开源的语音识别工具包，主干中有一个说话人识别系统（使用与语言识别系统类似的模型），沙盒语言id中有一个实验性语言识别设置，您可以使用svn开关^/sandbox/language_id切换到LID沙盒。LID示例在egs/lre07中

无论您使用哪种工具包，我建议使用基于I向量的系统，而不是语音系统。基于i-Vector的系统将更容易设置，因为它不需要转录本，而且速度更快，因为它避免了解码