Ios5 对于ios来说,最适合匹配几个关键词的语音识别API是什么?

Ios5 对于ios来说,最适合匹配几个关键词的语音识别API是什么?,ios5,sdk,speech-recognition,Ios5,Sdk,Speech Recognition,我正在寻找一个API的ios(免费的理想),将允许做一些语音识别。我已经看到了一些关于这方面的帖子:经过一番展望,我收集了一个看起来非常有趣的sdk: (非免费:-\) 有没有那些真正脱颖而出,而且是最近的?它们之间真正的区别是什么?Nuance为开发人员提供了免费访问(但不适用于高容量)-请参见或 Nuance服务通常以商业形式提供,需要预付费用和交易费用。上面有趣的消息是,他们现在免费向开发人员提供少量的服务。因此,对于开发、测试和演示,您可能可以使用免费的Nuance服务。然而,

我正在寻找一个API的ios(免费的理想),将允许做一些语音识别。我已经看到了一些关于这方面的帖子:经过一番展望,我收集了一个看起来非常有趣的sdk:

  • (非免费:-\)

有没有那些真正脱颖而出,而且是最近的?它们之间真正的区别是什么?

Nuance为开发人员提供了免费访问(但不适用于高容量)-请参见或


Nuance服务通常以商业形式提供,需要预付费用和交易费用。上面有趣的消息是,他们现在免费向开发人员提供少量的服务。因此,对于开发、测试和演示,您可能可以使用免费的Nuance服务。然而,与安卓系统中免费提供的谷歌服务不同,如果你的应用程序有数千名用户,你可能需要为Nuance服务付费。

如果你只想跟踪几个关键词,你不应该寻找语音识别API或服务。这项任务称为关键词识别,它使用不同于语音识别的算法。语音识别试图找到所有已经说过的单词,因此它比关键词识别消耗更多的资源。关键字检查器仅尝试查找少数选定的关键字或关键短语。它非常简单,而且资源消耗更少

归档此功能的唯一可能解决方案是使用Pocketsphinx支持的开源软件包,如OpenEars

Openears有一个Rejecto插件,它实现了类似的功能


Pocketsphinx本身最近也实现了开源有效的关键字识别,但它还没有进入开源程序。它只能通过pocketsphinx API使用,您需要创建kws搜索并设置要查找的目标单词。我希望这个功能也能很快实现。

我们从2008年开始开发CeedVocal SDK,它基于Julius&FLite开源项目

以下是一些背景:2008年,我们想制作语音识别应用程序(Vocalia),基本上选择了Julius(对Pocket Sphinx犹豫不决,它看起来也不错),并优化了它的文件格式,使它能够在1-2秒内启动,而不是在原来的iPhone上启动20秒。然后我们尽职尽责地用6种语言训练我们自己的声学模型。我们设计了API,并最终决定将其作为SDK提供给其他开发人员

CeedVocal基本上支持两种操作模式:

  • 单词(或小短语)的匹配
  • 关键词识别

  • 在第一种操作模式中,它尝试将输入语音与其可接受输入列表中的单词(或短语)对齐。这将强制输入一个已知的单词,即使该语音是其他内容。准确度很好。在第二种操作模式中,它将尝试在语音流中选择一个关键字。这是一个困难的案例,可能不太准确。

    谢谢Michael-它与同样免费的openears或iPeech有什么区别?你所说的高容量是什么意思:提取关键词需要处理的数据量?对不起,我对语音识别知之甚少。在我的情况下,我需要连续提取几个关键词(最多4/5):我不希望用户与应用程序交互时进入语音识别开启的模式。Nuance是商业语音识别领域的行业领导者。他们在网络方面与Cisco相似,在存储方面与EMC相似。他们是一家拥有业界领先技术的巨大成功公司。人们认为,细微差别提供了苹果Siri背后的识别技术。OpenEars(我相信)是Sphinx和其他开源识别器的开源iOS库。iSpeech来自新泽西州的一个小团队,他们似乎以DriveSafe.ly应用程序而闻名。对不起,我对它们了解得不多。如果你只是想找下面评论中提到的几句话,你最好用这个要求更新你的问题,但是
    OpenEars
    “准确性非常不一致,令人讨厌。你能提出更好的建议吗?@AbhishekBedi:OpenEars的准确性对我来说非常好,可能你没有正确使用它。你需要提供更多的信息才能得到帮助[.但是我不知道如何计算分数。欢迎你用更好的方式描述你的问题,并提供确切的细节。你在做什么,你期望得到什么,你实际得到什么。为了让分析变得容易,你需要提供你的声音录音。只要你提供足够的信息,这个问题很容易解决从使用openears的演示开始,我一开始对演示没有印象。我试着说,“测试”,它回答说,你说“转”。或者说,“不”,它说,你说“开始”.现在,当我意识到我只能使用一组固定的单词时,这改善了我的体验。此外,我认为几乎需要使用Rejecto插件来拒绝不在固定单词集中的单词。