Google cloud platform 使用gcloud工具时，我是否可以在Google Cloud语音到文本api中指定模型（例如“视频”）？_Google Cloud Platform_Google Api_Gcloud_Speech To Text

Google cloud platform 使用gcloud工具时，我是否可以在Google Cloud语音到文本api中指定模型（例如“视频”）？

google-cloud-platform google-api

Google cloud platform 使用gcloud工具时，我是否可以在Google Cloud语音到文本api中指定模型（例如“视频”）？,google-cloud-platform,google-api,gcloud,speech-to-text,Google Cloud Platform,Google Api,Gcloud,Speech To Text,谷歌的语音到文本服务有几种可能的模式可用于将语音转换为文本（标准、视频、电话等）。Google提供了在从Python或通过curl向语音到文本api发送请求时使用这些模型的方法。但我正在使用gcloud ml speech recognize向该API发出请求，并希望能够指定要使用的模型。我已经阅读了一页又一页的文档来了解这一点，但是还没有运气我的命令行脚本： gcloud ml speech recognize test.wav --language-code=EN --useEnhance

谷歌的语音到文本服务有几种可能的模式可用于将语音转换为文本（标准、视频、电话等）。Google提供了在从Python或通过curl向语音到文本api发送请求时使用这些模型的方法。但我正在使用

gcloud ml speech recognize

向该API发出请求，并希望能够指定要使用的模型。我已经阅读了一页又一页的文档来了解这一点，但是还没有运气

我的命令行脚本：

gcloud ml speech recognize test.wav --language-code=EN --useEnhanced=true

我还尝试了

--model=video

而不是

--useenshanced=true

谷歌的回应：

ERROR: (gcloud.ml.speech.recognize) unrecognized arguments: --useEnhanced=true

To search the help text of gcloud commands, run:
  gcloud help -- SEARCH_TERMS

请帮忙！谢谢：）

要指定默认型号示例“视频”，您可以将其作为一个组使用：

gcloud ml video // example

这是与gcloud参考的链接：

我无法使用gcloud工具使其工作，但我可以使用cURL“手动”完成。请按照此处的文档进行操作：。确保创建具有适当角色的服务帐户，下载生成的私钥，然后运行

export GOOGLE\u APPLICATION\u CREDENTIALS=path to CREDENTIALS.json

。然后根据您的请求创建一个JSON文件。我的是这样的：

{
“配置”：{
“语言代码”：“en US”，
“useEnhanced”：没错，
“模型”：“视频”
},
“音频”：{
“uri”：“gs://bucket/audio.flac”
}
}

然后，只需执行文档为recognize端点建议的cURL命令（注意将文件名更改为您创建的JSON），就可以了

以下是用于识别端点的文档：。您可以单击RecognitionConfig和RecognitionAudio对象，查看JSON文件中可以包含的内容。

感谢您的回复，但是

gcloud ml video

是另一种型号，用于处理视频内容。我链接到的文档显示，有一种特定于视频的语音识别模型，而不是用于处理视频内容。我更新了我的问题以防止将来混淆感谢Kevin，我最终使用了类似的解决方案：从这里的文档：我使用了python库。您还可以通过，并将其放置在

“audio”：{“content”：“…”}

部分。然后可以像这样运行curl命令：

curl--request POST--header“Content Type:application/json”--data“@json-file.json”https://speech.googleapis.com/v1p1beta1/speech:recognize?key=YOUR-API-KEY-HERE“