Speech recognition 无语法约束的文件识别_Speech Recognition_Cmusphinx

Speech recognition 无语法约束的文件识别

speech-recognition

Speech recognition 无语法约束的文件识别,speech-recognition,cmusphinx,Speech Recognition,Cmusphinx,作为用于将音频转换为文本的gram文件，我们只能识别有限数量的单词。有没有办法把音频转录成文本。我们是否可以增强gram文件以包含所有英语单词，从而可以识别任何英语单词？或者我们可以做些别的事情，这样我把任何音频文件转换成文本的目的就可以被释放了吗？我浪费了很多时间。任何想法都将不胜感激。提前感谢。要熟悉语音识别概念，请先阅读本教程包含所有单词的语法称为语言模型。美国英语的语言模型可在此处下载：要为其他语言创建语言模型，可以查看教程要使用语言模型进行解码，您可以使用sphinx4中的

作为用于将音频转换为文本的gram文件，我们只能识别有限数量的单词。有没有办法把音频转录成文本。我们是否可以增强gram文件以包含所有英语单词，从而可以识别任何英语单词？或者我们可以做些别的事情，这样我把任何音频文件转换成文本的目的就可以被释放了吗？我浪费了很多时间。任何想法都将不胜感激。提前感谢。

要熟悉语音识别概念，请先阅读本教程

包含所有单词的语法称为语言模型。美国英语的语言模型可在此处下载：

要为其他语言创建语言模型，可以查看教程

要使用语言模型进行解码，您可以使用sphinx4中的Transcriber demo或pocketsphinx_带-lm选项的连续二进制文件。像这样：

 pocketsphinx_continuous -infile file.wav -lm en_us.lm.dmp

Thanxx Nikolay…..您能告诉我如何编辑sphinx4.jar，以便它可以使用上述模型并将音频文件作为输入。在sphinx4中，此模型已默认用于转录器演示。有关详细信息，请参阅。但是sphinx4中包含的hello world程序使用非常短的gram文件。如果它使用语言模型，那么gram文件的用途是什么。如果需要，我们如何增加gram文件中的单词来检测音频文件中的任何单词。请按照链接仔细阅读。你好像没有读过。我读过所有的东西……你能帮我如何使用你在sphinx4中提供的语言模型吗。本教程在编写可将音频转换为文本的代码时有点让人困惑。。请