Google cloud platform 使用gcloud工具时,我是否可以在Google Cloud语音到文本api中指定模型(例如“视频”)?

Google cloud platform 使用gcloud工具时,我是否可以在Google Cloud语音到文本api中指定模型(例如“视频”)?,google-cloud-platform,google-api,gcloud,speech-to-text,Google Cloud Platform,Google Api,Gcloud,Speech To Text,谷歌的语音到文本服务有几种可能的模式可用于将语音转换为文本(标准、视频、电话等)。Google提供了在从Python或通过curl向语音到文本api发送请求时使用这些模型的方法。但我正在使用gcloud ml speech recognize向该API发出请求,并希望能够指定要使用的模型。我已经阅读了一页又一页的文档来了解这一点,但是还没有运气 我的命令行脚本: gcloud ml speech recognize test.wav --language-code=EN --useEnhance

谷歌的语音到文本服务有几种可能的模式可用于将语音转换为文本(标准、视频、电话等)。Google提供了在从Python或通过curl向语音到文本api发送请求时使用这些模型的方法。但我正在使用
gcloud ml speech recognize
向该API发出请求,并希望能够指定要使用的模型。我已经阅读了一页又一页的文档来了解这一点,但是还没有运气

我的命令行脚本:

gcloud ml speech recognize test.wav --language-code=EN --useEnhanced=true
我还尝试了
--model=video
而不是
--useenshanced=true

谷歌的回应:

ERROR: (gcloud.ml.speech.recognize) unrecognized arguments: --useEnhanced=true

To search the help text of gcloud commands, run:
  gcloud help -- SEARCH_TERMS

请帮忙!谢谢:)

要指定默认型号示例“视频”,您可以将其作为一个组使用:

gcloud ml video // example

这是与gcloud参考的链接:

我无法使用gcloud工具使其工作,但我可以使用cURL“手动”完成。请按照此处的文档进行操作:。确保创建具有适当角色的服务帐户,下载生成的私钥,然后运行
export GOOGLE\u APPLICATION\u CREDENTIALS=path to CREDENTIALS.json
。然后根据您的请求创建一个JSON文件。我的是这样的:

{
“配置”:{
“语言代码”:“en US”,
“useEnhanced”:没错,
“模型”:“视频”
},
“音频”:{
“uri”:“gs://bucket/audio.flac”
}
}
然后,只需执行文档为recognize端点建议的cURL命令(注意将文件名更改为您创建的JSON),就可以了


以下是用于识别端点的文档:。您可以单击RecognitionConfig和RecognitionAudio对象,查看JSON文件中可以包含的内容。

感谢您的回复,但是
gcloud ml video
是另一种型号,用于处理视频内容。我链接到的文档显示,有一种特定于视频的语音识别模型,而不是用于处理视频内容。我更新了我的问题以防止将来混淆感谢Kevin,我最终使用了类似的解决方案:从这里的文档:我使用了python库。您还可以通过,并将其放置在
“audio”:{“content”:“…”}
部分。然后可以像这样运行curl命令:
curl--request POST--header“Content Type:application/json”--data“@json-file.json”https://speech.googleapis.com/v1p1beta1/speech:recognize?key=YOUR-API-KEY-HERE“