Android 选择语音到文本API的建议

Android 选择语音到文本API的建议,android,speech-recognition,speech-to-text,speech,google-speech-api,Android,Speech Recognition,Speech To Text,Speech,Google Speech Api,我不熟悉语音识别,android和我有一个用例,我需要构建一个android应用程序,它从用户那里接收命令(有限的命令集,少于100个),并执行一些逻辑。我在谷歌上搜索了一下,发现可以做到以下几点 使用谷歌云语音api 使用Android内置的语音到文本功能(它与谷歌云语音api有区别吗?如果有,如何?)。另外,使用android语音到文本的离线模式的优缺点是什么 使用开源语音识别库,如Kaldi、CMU Sphinx(看起来他们需要花费大量精力收集和训练数据) 有人能建议我上面哪一个最适合我的

我不熟悉语音识别,android和我有一个用例,我需要构建一个android应用程序,它从用户那里接收命令(有限的命令集,少于100个),并执行一些逻辑。我在谷歌上搜索了一下,发现可以做到以下几点

  • 使用谷歌云语音api
  • 使用Android内置的语音到文本功能(它与谷歌云语音api有区别吗?如果有,如何?)。另外,使用android语音到文本的离线模式的优缺点是什么
  • 使用开源语音识别库,如Kaldi、CMU Sphinx(看起来他们需要花费大量精力收集和训练数据)
  • 有人能建议我上面哪一个最适合我的用例吗? 我的命令有限,速度对我来说最重要

    我真的很困惑,因此提出了这个问题。提前谢谢

    使用谷歌云语音api

    非常昂贵,因为你必须为每一个要求付费

    使用Android内置的语音到文本功能(它与谷歌云语音api有区别吗?如果有,如何?)。另外,使用android语音到文本的离线模式的优缺点是什么

    内置的API可以使用。它不同于云API,并且是免费的。不过,对于用户来说,它不能透明地脱机工作。坏的一面是速度慢,您无法配置词汇表。因此,它将解码所有单词,而不是某些特定的命令集,并且经常会将所需的命令与噪声中的其他单词混淆

    使用开源语音识别库,如Kaldi、CMU Sphinx(看起来他们需要花费大量精力收集和训练数据)

    适当的发展总是一种努力