Android 在线和离线语音到文本转换的区别

Android 在线和离线语音到文本转换的区别,android,speech-to-text,Android,Speech To Text,我正在开发语音到文本的android应用程序。谷歌API可用于在线和离线语音文本转换 我已经在GoogleAPI(在线ans和离线API)上完成了语音到文本的测试。据观察,与离线相比,在线语音文本转换提供了更好的准确性。现在我的问题是 在线模式和离线模式有什么区别 为什么脱机模式会降低其准确性?有没有更精确的解决方案 当我们接到任何电话时,数据连接就会丢失。有什么解决方案可以同时实现这两个目标吗 在线模式和离线模式有什么区别? 为什么脱机模式会降低其准确性?有没有更精确的解决方案 脱机模式基于文

我正在开发语音到文本的android应用程序。谷歌API可用于在线和离线语音文本转换

我已经在GoogleAPI(在线ans和离线API)上完成了语音到文本的测试。据观察,与离线相比,在线语音文本转换提供了更好的准确性。现在我的问题是

  • 在线模式和离线模式有什么区别
  • 为什么脱机模式会降低其准确性?有没有更精确的解决方案
  • 当我们接到任何电话时,数据连接就会丢失。有什么解决方案可以同时实现这两个目标吗
  • 在线模式和离线模式有什么区别? 为什么脱机模式会降低其准确性?有没有更精确的解决方案

    脱机模式基于文件大小约为20.3MB的型号;由于不需要internet连接,因此不需要发送/接收数据。无论如何,这种模式的语音转换速度比在线版本快6.5-7倍。这里重点提到的是,该模型的字错误率为13.5%,虽然不太高,但考虑到有限的数据和算法,该模型的字错误率相当高

    一个在线系统显然可以访问更多的训练数据,并通过更多的算法进行解析。我不认为离线版本可以被视为替代品,而是在在线版本不可用时作为替代品。我读过一些文章,其中用户声称“英语美国”比“英语英国”效果更好,原因我并不完全清楚

    3G不能同时提供语音和数据。WiFi/4G没有这个问题。还有许多其他已知问题,如来自服务提供商、LTE/非LTE、CDMA等的限制。如果您有这样的限制,一种方法可能是合并一些设计更改,以使您能够缓存数据,然后在呼叫完成后访问在线引擎

    根据我有限的经验,对于离线功能,CMUSphinx似乎是一个更好的选择(因为谷歌每天只能打50个电话(?)。下面列出了一些其他可用的API


    支持脱机语音转换为文本的研究论文链接在这里[]。

    嘿,谢谢你的快速回复。我试过用Pocketsphenx。使用链接中给出的示例:。它对数字的准确度很高,但对单词的准确度不高。您也可以尝试Kaldi,但请注意,脱机语音对文本的准确度非常有限,因此准确度不会很高。根据您的需求,也许您也可以使用1或2个API的组合,但我将由您决定。