iPhone上的语音识别

iPhone上的语音识别,iphone,speech-recognition,Iphone,Speech Recognition,我需要开发一个iPhone应用程序来识别语音,并根据结果执行进一步的任务 我知道iPhone3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理 是指我需要购买哪些软件并在服务器端实现它,以及如何使用该服务???我认为服务器端语音识别软件套件不多。开源版本似乎几乎不存在。不过,您可能想看看这个SDK: 它可以让你在iPhone上做你想做的事情 据我所知,最好的开源语音识别软件包是Sphinx。 否则,我建议研究Nuance软件 当前的语音识

我需要开发一个iPhone应用程序来识别语音,并根据结果执行进一步的任务

我知道iPhone3.0不支持语音识别,我需要在服务器端实现语音识别软件。我只知道这件事,因为我是新手,我不知道如何处理


是指我需要购买哪些软件并在服务器端实现它,以及如何使用该服务???

我认为服务器端语音识别软件套件不多。开源版本似乎几乎不存在。不过,您可能想看看这个SDK:


它可以让你在iPhone上做你想做的事情

据我所知,最好的开源语音识别软件包是Sphinx。

否则,我建议研究Nuance软件


当前的语音识别在有限的语法集上做得很好(如果你知道他们要说什么的话)。开放式听写仍然不能很好地用于许多应用程序。在开发应用程序时,请记住这一点。我现在希望谷歌进入转录游戏(使用谷歌语音),这应该会开始改善。我想他们将来可能会有所收获。

正确地识别语音是一个非常棘手和活跃的研究领域


不过,还有一些开源解决方案,请参阅。另外一个新的是,但我不知道它是否可以使用,或者只是一个概念证明。

查看。我们为各种平台(包括iOS)提供了库,必要时还提供了HTTP服务

你说服务器端是什么意思?他的意思是“不打电话”。这可能有助于指定您是否必须使用特定的服务器操作系统。服务器端意味着将音频数据发送到服务器,识别那里的语音(使用大量资源和内存),并将结果文本输出发送回手机。谷歌通过Android上的OCR和机器翻译做到了这一点,例如:获取一些外来文本的图片,它将其发送到服务器,OCR并将其翻译成英语,然后将文本结果发送回。