Speech recognition 基于音频集合的语音识别

Speech recognition 基于音频集合的语音识别,speech-recognition,speech-to-text,cmusphinx,pocketsphinx,sphinx4,Speech Recognition,Speech To Text,Cmusphinx,Pocketsphinx,Sphinx4,我收集了大量的音频文件,这些文件的抄本都是外语。 我希望能够识别用户是否背诵了文本中的正确单词。 如何开始使用CMU Sphinx来处理此问题?我需要语言模型、声学模型吗? 我想要一些指导,请和从哪里开始 如何开始使用CMU Sphinx来处理此问题 您可以识别音频并将其与转录进行比较。如果不匹配,您可以警告您的用户 我需要一个语言模型,声学模型吗 是的,两者都需要。您可以从集合中构建它们,但仍然需要引导数据。为了得到更多的建议,这里值得一提的语言 我想要一些指导,请和从哪里开始 从教程开始谢谢

我收集了大量的音频文件,这些文件的抄本都是外语。
我希望能够识别用户是否背诵了文本中的正确单词。
如何开始使用CMU Sphinx来处理此问题?我需要语言模型、声学模型吗?
我想要一些指导,请和从哪里开始

如何开始使用CMU Sphinx来处理此问题

您可以识别音频并将其与转录进行比较。如果不匹配,您可以警告您的用户

我需要一个语言模型,声学模型吗

是的,两者都需要。您可以从集合中构建它们,但仍然需要引导数据。为了得到更多的建议,这里值得一提的语言

我想要一些指导,请和从哪里开始


从教程开始

谢谢。语言是希伯来语。你能给我指一个更具体的教程吗?我都迷路了。你能告诉我我需要做的步骤吗?好的,希伯来语还不受支持,你必须建立模型或使用商业模型。好的。1.有商业版的吗?哪里2.因为我只需要音频和转录本中的单词,不是更简单吗?如果是的话,我应该采取什么具体的方法?有商业模型,你可以联系我以供参考。由于数据收集的要求,声学模型培训通常需要几个月的时间,但如果有时间,也可以这样做。你也可以考虑使用谷歌语音API,它支持希伯来文。我想使用谷歌语音API。问题是它不是那么准确。有没有可能通过给它一个可能的单词列表来训练它,或者使它更准确?