Android CMU Sphinx是否可以设置为识别约200个单词

Android CMU Sphinx是否可以设置为识别约200个单词,android,speech-recognition,speech-to-text,Android,Speech Recognition,Speech To Text,我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知,内置的语音到文本功能实际上会将数据发送到谷歌的服务器,然后服务器会发回文本翻译。这是一个大问题,因为语音数据非常敏感(除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密) 我可以想到两个选择。首先是在Android上将语音转换为文本,尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据(我可以在语音数据发送到和从中发送时加密语音数据和翻译)。这是芝加哥大学斯芬克斯分校能做到的吗?值

我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知,内置的语音到文本功能实际上会将数据发送到谷歌的服务器,然后服务器会发回文本翻译。这是一个大问题,因为语音数据非常敏感(除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密)

我可以想到两个选择。首先是在Android上将语音转换为文本,尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据(我可以在语音数据发送到和从中发送时加密语音数据和翻译)。这是芝加哥大学斯芬克斯分校能做到的吗?值得注意的是,我还可以访问星号服务器,这可能有助于实现这一点(我不知道)

实际上,应该只有约200个单词需要识别。我更喜欢开源/自由软件解决方案,但我也对商业解决方案持开放态度(可能是FlexT9)。理想情况下,我可以将音频流发送到某个地方,返回一个字符串,即文本,然后我可以解析该字符串并使用该字符串执行其他操作

我在过去没有做过很多android或任何语音识别的开发,所以我希望有人至少能给我指出正确的方向。谢谢

是一个开源语音识别工具包,可用于构建应用程序。它包含的工具、库和数据将使您能够构建语音应用程序。你可以在上面的网站上了解更多关于CMUSphinx的信息

在Android上,您有几个选项可以使用CMUSphinx:

  • 识别设备上的音频。为此,您可以为android编译Pocketsphinx引擎。详情请参阅

  • 识别服务器上的音频。作为服务器,您可以使用Pocketsphinx或Sphinx4。您可以发送压缩flac格式的音频,或提取设备上的语音识别功能,并将功能流发送到服务器

  • CMUSphinx为您提供了几种声学模型,使您能够识别英语、法语、普通话、德语、荷兰语、俄语等多种语言的音频

    您还可以使用自适应工具改进识别结果


    如果您对CMUSphinx有任何疑问,欢迎使用。

    微软语音引擎是一款开源但免费的软件。有关背景信息,请参见。想了解更多背景知识,你可以试试


    有关Microsoft Server Speech Platform 11的完整SDK,请访问。语音引擎是免费下载的。

    微软的Android解决方案(您建议的解决方案)也可用吗?它只是一个服务器端组件。您必须构建自己的客户端实现来捕获音频并将其发送到服务器。