Speech recognition 基于音频集合的语音识别_Speech Recognition_Speech To Text_Cmusphinx_Pocketsphinx_Sphinx4

Speech recognition 基于音频集合的语音识别

speech-recognition

Speech recognition 基于音频集合的语音识别,speech-recognition,speech-to-text,cmusphinx,pocketsphinx,sphinx4,Speech Recognition,Speech To Text,Cmusphinx,Pocketsphinx,Sphinx4,我收集了大量的音频文件，这些文件的抄本都是外语。我希望能够识别用户是否背诵了文本中的正确单词。如何开始使用CMU Sphinx来处理此问题？我需要语言模型、声学模型吗？我想要一些指导，请和从哪里开始如何开始使用CMU Sphinx来处理此问题您可以识别音频并将其与转录进行比较。如果不匹配，您可以警告您的用户我需要一个语言模型，声学模型吗是的，两者都需要。您可以从集合中构建它们，但仍然需要引导数据。为了得到更多的建议，这里值得一提的语言我想要一些指导，请和从哪里开始从教程开始谢谢

我收集了大量的音频文件，这些文件的抄本都是外语。
我希望能够识别用户是否背诵了文本中的正确单词。
如何开始使用CMU Sphinx来处理此问题？我需要语言模型、声学模型吗？
我想要一些指导，请和从哪里开始

如何开始使用CMU Sphinx来处理此问题

您可以识别音频并将其与转录进行比较。如果不匹配，您可以警告您的用户

我需要一个语言模型，声学模型吗

是的，两者都需要。您可以从集合中构建它们，但仍然需要引导数据。为了得到更多的建议，这里值得一提的语言

我想要一些指导，请和从哪里开始

从教程开始

谢谢。语言是希伯来语。你能给我指一个更具体的教程吗？我都迷路了。你能告诉我我需要做的步骤吗？好的，希伯来语还不受支持，你必须建立模型或使用商业模型。好的。1.有商业版的吗？哪里2.因为我只需要音频和转录本中的单词，不是更简单吗？如果是的话，我应该采取什么具体的方法？有商业模型，你可以联系我以供参考。由于数据收集的要求，声学模型培训通常需要几个月的时间，但如果有时间，也可以这样做。你也可以考虑使用谷歌语音API，它支持希伯来文。我想使用谷歌语音API。问题是它不是那么准确。有没有可能通过给它一个可能的单词列表来训练它，或者使它更准确？