Speech recognition 无语法约束的文件识别

Speech recognition 无语法约束的文件识别,speech-recognition,cmusphinx,Speech Recognition,Cmusphinx,作为用于将音频转换为文本的gram文件,我们只能识别有限数量的单词。有没有办法把音频转录成文本。我们是否可以增强gram文件以包含所有英语单词,从而可以识别任何英语单词?或者我们可以做些别的事情,这样我把任何音频文件转换成文本的目的就可以被释放了吗?我浪费了很多时间。任何想法都将不胜感激。提前感谢。要熟悉语音识别概念,请先阅读本教程 包含所有单词的语法称为语言模型。美国英语的语言模型可在此处下载: 要为其他语言创建语言模型,可以查看教程 要使用语言模型进行解码,您可以使用sphinx4中的

作为用于将音频转换为文本的gram文件,我们只能识别有限数量的单词。有没有办法把音频转录成文本。我们是否可以增强gram文件以包含所有英语单词,从而可以识别任何英语单词?或者我们可以做些别的事情,这样我把任何音频文件转换成文本的目的就可以被释放了吗?我浪费了很多时间。任何想法都将不胜感激。提前感谢。

要熟悉语音识别概念,请先阅读本教程

包含所有单词的语法称为语言模型。美国英语的语言模型可在此处下载:

要为其他语言创建语言模型,可以查看教程

要使用语言模型进行解码,您可以使用sphinx4中的Transcriber demo或pocketsphinx_带-lm选项的连续二进制文件。像这样:

 pocketsphinx_continuous -infile file.wav -lm en_us.lm.dmp

Thanxx Nikolay…..您能告诉我如何编辑sphinx4.jar,以便它可以使用上述模型并将音频文件作为输入。在sphinx4中,此模型已默认用于转录器演示。有关详细信息,请参阅。但是sphinx4中包含的hello world程序使用非常短的gram文件。如果它使用语言模型,那么gram文件的用途是什么。如果需要,我们如何增加gram文件中的单词来检测音频文件中的任何单词。请按照链接仔细阅读。你好像没有读过。我读过所有的东西……你能帮我如何使用你在sphinx4中提供的语言模型吗。本教程在编写可将音频转换为文本的代码时有点让人困惑。。请