Android CMU Sphinx是否可以设置为识别约200个单词_Android_Speech Recognition_Speech To Text

Android CMU Sphinx是否可以设置为识别约200个单词

android speech-recognition

Android CMU Sphinx是否可以设置为识别约200个单词,android,speech-recognition,speech-to-text,Android,Speech Recognition,Speech To Text,我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知，内置的语音到文本功能实际上会将数据发送到谷歌的服务器，然后服务器会发回文本翻译。这是一个大问题，因为语音数据非常敏感（除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密）我可以想到两个选择。首先是在Android上将语音转换为文本，尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据（我可以在语音数据发送到和从中发送时加密语音数据和翻译）。这是芝加哥大学斯芬克斯分校能做到的吗？值

我有一个客户需要一个能够识别口头命令的Android应用程序。据我所知，内置的语音到文本功能实际上会将数据发送到谷歌的服务器，然后服务器会发回文本翻译。这是一个大问题，因为语音数据非常敏感（除非在发送到谷歌和从谷歌发送数据时对数据进行了加密——但我怀疑它是否加密）

我可以想到两个选择。首先是在Android上将语音转换为文本，尽管这似乎是一项极其昂贵的操作。第二种可能性是让一个本地服务器为我转换数据（我可以在语音数据发送到和从中发送时加密语音数据和翻译）。这是芝加哥大学斯芬克斯分校能做到的吗？值得注意的是，我还可以访问星号服务器，这可能有助于实现这一点（我不知道）

实际上，应该只有约200个单词需要识别。我更喜欢开源/自由软件解决方案，但我也对商业解决方案持开放态度（可能是FlexT9）。理想情况下，我可以将音频流发送到某个地方，返回一个字符串，即文本，然后我可以解析该字符串并使用该字符串执行其他操作

我在过去没有做过很多android或任何语音识别的开发，所以我希望有人至少能给我指出正确的方向。谢谢

是一个开源语音识别工具包，可用于构建应用程序。它包含的工具、库和数据将使您能够构建语音应用程序。你可以在上面的网站上了解更多关于CMUSphinx的信息

在Android上，您有几个选项可以使用CMUSphinx：

识别设备上的音频。为此，您可以为android编译Pocketsphinx引擎。详情请参阅

识别服务器上的音频。作为服务器，您可以使用Pocketsphinx或Sphinx4。您可以发送压缩flac格式的音频，或提取设备上的语音识别功能，并将功能流发送到服务器

CMUSphinx为您提供了几种声学模型，使您能够识别英语、法语、普通话、德语、荷兰语、俄语等多种语言的音频

您还可以使用自适应工具改进识别结果

如果您对CMUSphinx有任何疑问，欢迎使用。

微软语音引擎是一款开源但免费的软件。有关背景信息，请参见。想了解更多背景知识，你可以试试

有关Microsoft Server Speech Platform 11的完整SDK，请访问。语音引擎是免费下载的。

微软的Android解决方案（您建议的解决方案）也可用吗？它只是一个服务器端组件。您必须构建自己的客户端实现来捕获音频并将其发送到服务器。