Android CMU Sphinx是否可以设置为识别约200个单词
我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知,内置的语音到文本功能实际上会将数据发送到谷歌的服务器,然后服务器会发回文本翻译。这是一个大问题,因为语音数据非常敏感(除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密) 我可以想到两个选择。首先是在Android上将语音转换为文本,尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据(我可以在语音数据发送到和从中发送时加密语音数据和翻译)。这是芝加哥大学斯芬克斯分校能做到的吗?值得注意的是,我还可以访问星号服务器,这可能有助于实现这一点(我不知道) 实际上,应该只有约200个单词需要识别。我更喜欢开源/自由软件解决方案,但我也对商业解决方案持开放态度(可能是FlexT9)。理想情况下,我可以将音频流发送到某个地方,返回一个字符串,即文本,然后我可以解析该字符串并使用该字符串执行其他操作 我在过去没有做过很多android或任何语音识别的开发,所以我希望有人至少能给我指出正确的方向。谢谢 是一个开源语音识别工具包,可用于构建应用程序。它包含的工具、库和数据将使您能够构建语音应用程序。你可以在上面的网站上了解更多关于CMUSphinx的信息 在Android上,您有几个选项可以使用CMUSphinx:Android CMU Sphinx是否可以设置为识别约200个单词,android,speech-recognition,speech-to-text,Android,Speech Recognition,Speech To Text,我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知,内置的语音到文本功能实际上会将数据发送到谷歌的服务器,然后服务器会发回文本翻译。这是一个大问题,因为语音数据非常敏感(除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密) 我可以想到两个选择。首先是在Android上将语音转换为文本,尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据(我可以在语音数据发送到和从中发送时加密语音数据和翻译)。这是芝加哥大学斯芬克斯分校能做到的吗?值
如果您对CMUSphinx有任何疑问,欢迎使用。微软语音引擎是一款开源但免费的软件。有关背景信息,请参见。想了解更多背景知识,你可以试试
有关Microsoft Server Speech Platform 11的完整SDK,请访问。语音引擎是免费下载的。微软的Android解决方案(您建议的解决方案)也可用吗?它只是一个服务器端组件。您必须构建自己的客户端实现来捕获音频并将其发送到服务器。