Ios 为视障用户提供语音输入,无需轻触屏幕

Ios 为视障用户提供语音输入,无需轻触屏幕,ios,accessibility,speech-to-text,Ios,Accessibility,Speech To Text,我们正在为盲人和视障用户开发一款应用程序。我们一直在尝试使用第三方库来获取用户的语音输入并将其转换为文本,然后将其解析为控制应用程序的命令。问题是,单词识别不是很好,当然也没有iOS用于在文本字段上获取语音输入的效果好 我想尝试一下,但我们的用户大多无法点击文本字段,然后点击弹出式键盘上的麦克风按钮,然后点击完成按钮,甚至无法关闭其中任何一个。我甚至不知道他们如何处理整个屏幕上的一次点击,这对一些人来说可能太难了。所以,我想为他们实现自动化,但我在文档中没有看到任何迹象表明这是可能的。那么,有可

我们正在为盲人和视障用户开发一款应用程序。我们一直在尝试使用第三方库来获取用户的语音输入并将其转换为文本,然后将其解析为控制应用程序的命令。问题是,单词识别不是很好,当然也没有iOS用于在文本字段上获取语音输入的效果好


我想尝试一下,但我们的用户大多无法点击文本字段,然后点击弹出式键盘上的麦克风按钮,然后点击完成按钮,甚至无法关闭其中任何一个。我甚至不知道他们如何处理整个屏幕上的一次点击,这对一些人来说可能太难了。所以,我想为他们实现自动化,但我在文档中没有看到任何迹象表明这是可能的。那么,有可能吗?如果有,怎样做才能通过验证呢?

获得iOS口述的唯一方法是自己通过Nuance注册:-这很昂贵,因为它是最好的。据推测,苹果的合同阻止他们公开API


内置的iOS可访问性功能允许固定用户通过画外音和辅助触摸等工具访问听写(和其他键盘按钮)。如果您的用户可能熟悉这些工具,则可能不值得重新发明

您的解决方案是实现关键字定位,这样语音识别将使用关键字而不是按键激活。之后,您可以录制命令/文本,并使用所需的任何服务识别它们。类似于摩托罗拉X上的“Ok google”激活


iOS有几个关键字激活库,一个可能的解决方案是基于开源语音识别库的OpenEars。如果你想直接使用Pocketsphinx,你可以在subversion(Branchs/kws)的kws branch中找到关键字激活实现。

谢谢Aaron,但是Nuance对于一个独立的免费应用来说太贵了。而且他们的开发层对于实际开发来说限制太多了,我想我们可以轻松地使用所有这些功能。我们构建此应用程序的原因是为了克服现有解决方案的缺点。尽管它们很好,iOS也远远领先于其他任何人,主要问题是它们使用起来很乏味,视力正常的人用现有的工具在几秒钟内做的事情需要很长时间。我想做的是尝试用一些不需要任何精确触摸的东西来驱动现有的文本输入。我们目前正在评估Dragon的iOS框架:哪一个有更好的定价。我认为细微差别和龙是一样的,但可能有一些差异我还没有发现。当我们完成对框架的评估后,我将发布更多信息。“现在我只能说,这看起来是最好的解决办法。”弗兰克。谢谢你的更新。请让我知道;我很好奇你的决定。我们决定对代码进行结构化,以允许我们在构建设置中使用iSpeech或Dragon,因为它们有类似的API。正如我提到的,该应用程序需要尽快实现功能,团队的其他成员都是新人,我们只有几个月的时间,所以这似乎是一个更好的短期解决方案。我们将在很短的时间内收回费用,希望该应用程序能够获得支持。如果真是这样,我们将深入挖掘,看看是否可以得到更好的交易,或者使用“免费”的东西,比如CMUSphinx,或者找到资金来帮助支付账单。这两个答案都表明我没有试图欺骗系统使用键盘,这是避免麻烦进入应用商店的正确答案。但Aaron的回答是第一个,也让我们重新考虑细微差别,并引导我们找到更好的定价,这是我们现在最有利的做法。如果我能分享这个复选标记,我会把它分开,但我不能。感谢两位回答者的帮助!谢谢,我们必须考虑这一方法,但它为用户添加了一个额外的步骤,我们希望避免。他们现在需要告诉Siri启动该应用程序,最好我们直接进入语音识别,因为没有其他理由使用我们的应用程序。但这也许是可以接受的,它需要一些研究和考虑。我们已经看过CMUSphinx,但被告知它没有得到积极的支持。你用过吗?开场白呢?文档建议它需要培训,对吗?openears和CMUSphinx都有比任何商业工具包更好的支持。您可以在此处查看标有cmusphinx的问题,了解这一点。不需要培训。谢谢你,尼古拉,但我们现在决定跳过CMUSphinx。这个团队都是应届毕业生,我作为需要的有经验的人参与进来,看起来我们在这么短的跑道上投入了更多的精力来启动这个应用程序。我们看到的商业软件包都是一键下载,拖放安装,并且有简单的API。如果该应用程序获得支持,我们会回来花时间对CMUSphinx进行深入评估,以避免收费。目前,使用商业解决方案是更好的商业决策。