C++ 如何在C+中实现语音识别和文本到语音+;?

C++ 如何在C+中实现语音识别和文本到语音+;?,c++,speech-recognition,C++,Speech Recognition,我想知道做语音识别和文本到语音转换的各种技术。 另外,请让我知道任何资源,如链接,教程,电子书等 从你提到MS以来,哪种技术最有效- 你应该看看这个网站。它包含许多用于处理语音的资源,包括TTS和语音识别。我将回答关于语音识别的部分(因为我对文本到语音不太了解): 这本书《语音识别的统计方法》是一本解释统计语音识别数学基础的经典著作,由该领域的创始人弗雷德里克·杰利内克(Frederick Jelinek)撰写 你必须知道的最重要的概念是。几十年来,人们一直在使用它们进行语音识别。最近的一种方

我想知道做语音识别和文本到语音转换的各种技术。 另外,请让我知道任何资源,如链接,教程,电子书等


从你提到MS以来,哪种技术最有效-


你应该看看这个网站。它包含许多用于处理语音的资源,包括TTS和语音识别。

我将回答关于语音识别的部分(因为我对文本到语音不太了解):

这本书《语音识别的统计方法》是一本解释统计语音识别数学基础的经典著作,由该领域的创始人弗雷德里克·杰利内克(Frederick Jelinek)撰写

你必须知道的最重要的概念是。几十年来,人们一直在使用它们进行语音识别。最近的一种方法使用,请参阅和相关的软件工具包


编写自己的语音识别器相当困难。这是一个活跃的研究领域,有几次科学会议,例如。

如果您正在寻找一些实际的代码,请查看CMU的开源语音识别项目。它不是用C++编写的,但是如果你对算法感兴趣,它可以实现一堆你可以学习的东西。(我也想重复@dehmann的观点:阅读隐马尔可夫模型。)

这两个领域都非常广泛。 关于识别:在这篇文章中,你会发现如何建立一个基本的自动语音识别系统。无论如何,它都不接近艺术的开始,但它是可以实现的,而且它是有效的。如果您想做更高级的事情,请阅读倒谱系数和隐马尔可夫模型。看看,它是一个广泛使用的隐马尔可夫模型工具包


关于文字到语音:我想看看。

有多个斯芬克斯。主要的活跃分子是pocketsphinx和sphinx4

Sphinx4是用Java编写的。它更适合桌面和web应用程序

Pocketsphinx是用C编写的。它更适合于嵌入式设备。有iphone/android应用程序使用它

听起来你想要口袋狮身人面像。请试用本教程:

问pocketsphinx/sphinx4问题的更好地方是CMU的sourceforge论坛

你也应该提供更多的信息,比如你打算做什么


至于书籍,语音识别的圣经是“口语处理”

如果你想知道如何处理你奇特的语音识别,你应该阅读: Randy Allen Harris的语音交互设计


关于何时使用语音以及如何在应用程序中使用语音,它提供了一些很好的建议。

关于如何在Android上运行PocketSphinx,有什么指导吗?(见问题:)