Google api Google语音API是否可以配置为只返回数字/字母？_Google Api_Google Cloud Platform_Voice Recognition_Google Speech Api_Google Cloud Speech

Google api Google语音API是否可以配置为只返回数字/字母？

google-api google-cloud-platform

Google api Google语音API是否可以配置为只返回数字/字母？,google-api,google-cloud-platform,voice-recognition,google-speech-api,google-cloud-speech,Google Api,Google Cloud Platform,Voice Recognition,Google Speech Api,Google Cloud Speech,谷歌语音API是否可以配置为只返回数字和字母，而不是完整的单词用例是翻译加拿大邮政编码。例如M 1 B 0 R 3。谷歌可能会返回“EM1是0是3” 我们已尝试：使用speechcontext并以字母A-Z作为单独的短语输入。这提高了我们的准确性。我们在传递单个数字（例如1、2、3）方面没有太大成功使用encoding和sampleRateHertz配置选项指定WAV文件的编解码器和采样率。我们认为谷歌在自动识别采样率和编码方面已经做得很好了，所以在这方面我们没有看到任何改进我们的

谷歌语音API是否可以配置为只返回数字和字母，而不是完整的单词

用例是翻译加拿大邮政编码。例如M 1 B 0 R 3。谷歌可能会返回“EM1是0是3”

我们已尝试：

使用
```
speechcontext
```
并以字母A-Z作为单独的短语输入。这提高了我们的准确性。我们在传递单个数字（例如1、2、3）方面没有太大成功
使用
```
encoding
```
和
```
sampleRateHertz
```
配置选项指定WAV文件的编解码器和采样率。我们认为谷歌在自动识别采样率和编码方面已经做得很好了，所以在这方面我们没有看到任何改进

我们的音频文件为8000hz，编码为“M-ULAW”。我们在更改采样率或编码方面没有灵活性

有没有一种方法可以让谷歌对这个用例做出更准确的回应？甚至更好的

speechcontext

短语的想法也受到欢迎

谢谢你

我们也遇到了同样的结果，我们希望有一个基于语法的“上下文”建议或一个参数来强制只返回数字变量

api版本的变化并没有改变识别数字的方式，甚至没有使用model:phone\u call

对于识别某种号码来说，实际上更好的方法是切换到en_US语言环境，这反过来又迫使识别引擎将号码列表识别为电话。因此，它以类似电话的语法返回+XXX-XXX-XXX-XXXX，这使得检测非常好

所以我不明白为什么谷歌在幕后有语法匹配，而不通过他们的api提供语法匹配。

你目前的准确度是多少？你还问，在这种情况下，最好培训开源识别器，它的响应性也会更好。我想你指的是像CMUSphinx这样的工具，我看你是这方面的开发者。我可以试一试，因为这是一个全新的项目。是的，我问的问题和我用Bing语音测试的问题一样。但这个问题略有不同，因为我相信微软提供了更精细的控制，或“场景”，来解释演讲。我目前的准确率很低——大约35%的匹配率。