Audio 音频语言识别

Audio 音频语言识别,audio,cmusphinx,Audio,Cmusphinx,我正在寻找一个开源库来检测音频文件(如wav文件)中使用的口语 我试过CMU sphinx,但不知道如何使用它进行语言检测?有人能帮忙吗?您可以在所有电话解码模式下尝试CMU sphinx。 为您希望识别的语言培训模型。 如果假设你愿意学习另一个工具包,你应该考虑Kaldi[]。这是一个开源的语音识别工具包,主干中有一个说话人识别系统(使用与语言识别系统类似的模型),沙盒语言id中有一个实验性语言识别设置,您可以使用svn开关^/sandbox/language_id切换到LID沙盒。LID示例

我正在寻找一个开源库来检测音频文件(如wav文件)中使用的口语


我试过CMU sphinx,但不知道如何使用它进行语言检测?有人能帮忙吗?

您可以在所有电话解码模式下尝试CMU sphinx。 为您希望识别的语言培训模型。
如果假设你愿意学习另一个工具包,你应该考虑Kaldi[]。这是一个开源的语音识别工具包,主干中有一个说话人识别系统(使用与语言识别系统类似的模型),沙盒语言id中有一个实验性语言识别设置,您可以使用svn开关^/sandbox/language_id切换到LID沙盒。LID示例在egs/lre07中

无论您使用哪种工具包,我建议使用基于I向量的系统,而不是语音系统。基于i-Vector的系统将更容易设置,因为它不需要转录本,而且速度更快,因为它避免了解码