Google api Google语音API是否可以配置为只返回数字/字母?

Google api Google语音API是否可以配置为只返回数字/字母?,google-api,google-cloud-platform,voice-recognition,google-speech-api,google-cloud-speech,Google Api,Google Cloud Platform,Voice Recognition,Google Speech Api,Google Cloud Speech,谷歌语音API是否可以配置为只返回数字和字母,而不是完整的单词 用例是翻译加拿大邮政编码。 例如M 1 B 0 R 3。谷歌可能会返回“EM1是0是3” 我们已尝试: 使用speechcontext并以字母A-Z作为单独的短语输入。这提高了我们的准确性。我们在传递单个数字(例如1、2、3)方面没有太大成功 使用encoding和sampleRateHertz配置选项指定WAV文件的编解码器和采样率。我们认为谷歌在自动识别采样率和编码方面已经做得很好了,所以在这方面我们没有看到任何改进 我们的

谷歌语音API是否可以配置为只返回数字和字母,而不是完整的单词

用例是翻译加拿大邮政编码。 例如M 1 B 0 R 3。谷歌可能会返回“EM1是0是3”

我们已尝试:

  • 使用
    speechcontext
    并以字母A-Z作为单独的短语输入。这提高了我们的准确性。我们在传递单个数字(例如1、2、3)方面没有太大成功
  • 使用
    encoding
    sampleRateHertz
    配置选项指定WAV文件的编解码器和采样率。我们认为谷歌在自动识别采样率和编码方面已经做得很好了,所以在这方面我们没有看到任何改进
我们的音频文件为8000hz,编码为“M-ULAW”。我们在更改采样率或编码方面没有灵活性

有没有一种方法可以让谷歌对这个用例做出更准确的回应?甚至更好的
speechcontext
短语的想法也受到欢迎


谢谢你

我们也遇到了同样的结果,我们希望有一个基于语法的“上下文”建议或一个参数来强制只返回数字变量

api版本的变化并没有改变识别数字的方式,甚至没有使用model:phone\u call

对于识别某种号码来说,实际上更好的方法是切换到en_US语言环境,这反过来又迫使识别引擎将号码列表识别为电话。因此,它以类似电话的语法返回+XXX-XXX-XXX-XXXX,这使得检测非常好


所以我不明白为什么谷歌在幕后有语法匹配,而不通过他们的api提供语法匹配。

你目前的准确度是多少?你还问,在这种情况下,最好培训开源识别器,它的响应性也会更好。我想你指的是像CMUSphinx这样的工具,我看你是这方面的开发者。我可以试一试,因为这是一个全新的项目。是的,我问的问题和我用Bing语音测试的问题一样。但这个问题略有不同,因为我相信微软提供了更精细的控制,或“场景”,来解释演讲。我目前的准确率很低——大约35%的匹配率。