C# 如何从语音文件中识别短语
如何让引擎成功识别语音文件(wav/mp3/etc…)中的短语 例如,如果我有一个语音文件和一个同一文件上下文的书面文本,那么它可以识别语音文件中的书面单词 我试着玩SpeechRecognitionEngine,但到目前为止没有成功 我很欣赏这些想法,因为这是我第一次使用语音识别技术C# 如何从语音文件中识别短语,c#,visual-studio-2010,speech-recognition,C#,Visual Studio 2010,Speech Recognition,如何让引擎成功识别语音文件(wav/mp3/etc…)中的短语 例如,如果我有一个语音文件和一个同一文件上下文的书面文本,那么它可以识别语音文件中的书面单词 我试着玩SpeechRecognitionEngine,但到目前为止没有成功 我很欣赏这些想法,因为这是我第一次使用语音识别技术 我见过使用字典从语音到文本转换的例子,但我不确定它在这里有什么用处。我想把全语音文件转换成文本,然后简单地查找文本中的特定短语,但我认为这不是正确的方法。例如,将5小时语音转换为文本似乎没有意义。。。。或者可以将
我见过使用字典从语音到文本转换的例子,但我不确定它在这里有什么用处。我想把全语音文件转换成文本,然后简单地查找文本中的特定短语,但我认为这不是正确的方法。例如,将5小时语音转换为文本似乎没有意义。。。。或者可以将特定短语用作“词典”,并在语音文件中查找此项。根据MSDN文章 你需要做的步骤是(从文章)。请注意“创建识别语法”步骤。文章接着建议使用or类 语音识别应用程序通常会执行以下基本操作:
-启动语音识别器。
-创建识别语法。
-将语法加载到语音识别器中。
-注册语音识别事件通知。
-为语音识别事件创建处理程序
似乎您需要在一个长文件中查找特定的单词。这种技术被称为“关键词识别”,它与语音识别有很大不同,更有效。显然,您不需要转录整个文件来搜索其中的一个单词,您可以快速扫描整个文件。Microsoft语音识别引擎对关键字识别的支持非常有限 像这样的开源引擎可以用来高效地实现关键字发现。有关更多参考信息,请参阅
有关底层算法的更多信息,请参见如果您试图使用Microsoft语音引擎转换音频文件,则必须小心。首先,支持的唯一格式是WAV(它可以编码为PCM、ALaw或uLaw),但您必须验证您的文件是否采用识别器支持的格式。您还必须验证采样率。识别器仅支持一组固定的采样率。在我的机器上
- 每个样本8位
- 单通道单声道
- 每秒22050个样本
- PCM编码
最后,(对不起,我总是重复这一点)有一篇关于Windows.NET中编程识别的伟大文章。看,这有点过时了,不过是一个很好的介绍。感谢那些降级的家伙。。。但是你也能帮我回答一些问题吗?:)我编辑了一点问题,用我想的方向。。。我想到的是将整个语音转换成文本,然后执行简单的搜索,但这似乎是一个愚蠢的解决方案。。。