Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/google-cloud-platform/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud platform 谷歌语音到文本错误:“quot;无效识别';配置';:错误的编码……”;下载MP3文件_Google Cloud Platform_Speech Recognition_Speech To Text_Google Speech Api_Google Cloud Speech - Fatal编程技术网

Google cloud platform 谷歌语音到文本错误:“quot;无效识别';配置';:错误的编码……”;下载MP3文件

Google cloud platform 谷歌语音到文本错误:“quot;无效识别';配置';:错误的编码……”;下载MP3文件,google-cloud-platform,speech-recognition,speech-to-text,google-speech-api,google-cloud-speech,Google Cloud Platform,Speech Recognition,Speech To Text,Google Speech Api,Google Cloud Speech,我正在react web应用程序中使用“mic-recorder-to-mp3”节点包录制音频 我使用MediaInfo查看了使用此库()生成的音频文件,它显示了以下信息: 因此,它似乎没有损坏或其他任何东西…但是,当我使用以下代码运行Google的语音到文本API时,我得到了错误:“无效的识别'config':错误的编码…” 我不明白这里出了什么问题……任何帮助都将不胜感激 我能够重现问题,似乎使用的编码是根本原因,我使用了gcloud ml speech recognize命令,但没有得到

我正在react web应用程序中使用“mic-recorder-to-mp3”节点包录制音频

我使用MediaInfo查看了使用此库()生成的音频文件,它显示了以下信息:

因此,它似乎没有损坏或其他任何东西…但是,当我使用以下代码运行Google的语音到文本API时,我得到了错误:“无效的识别'config':错误的编码…”


我不明白这里出了什么问题……任何帮助都将不胜感激

我能够重现问题,似乎使用的编码是根本原因,我使用了
gcloud ml speech recognize
命令,但没有得到响应:

gcloud ml speech recognize gs://MY_BUCKET/audioClip.mp3 --language-code=en-US --encoding=linear16 --sample-rate=48000

{}
之后,我更改了文件的编码:

ffmpeg -i audioClip.mp3 audioClip.wav
然后我又试了一次,瞧:

gcloud ml speech recognize gs://MY_BUCKET/audioClip.wav --language-code=en-US --encoding=linear16 --sample-rate=48000

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.7809482,
          "transcript": "testing testing 1 2 3"
        }
      ]
    }
  ]
}

请考虑,根据这个MP3编码是一个beta特性,只能在V1P1BETA1中使用。所以,你应该考虑将文件转换成语音到文本API。

我们没有访问文件的发布,有可能公开对我进行测试吗?嗨,恩里克。很抱歉,我刚刚更改了驱动器链接的权限,所以现在应该可以正常工作了。我试过使用另一个麦克风库,它现在正在为我工作,但我认为如果我们能够解决这个问题,它对我和其他人仍然是有用的
gcloud ml speech recognize gs://MY_BUCKET/audioClip.wav --language-code=en-US --encoding=linear16 --sample-rate=48000

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.7809482,
          "transcript": "testing testing 1 2 3"
        }
      ]
    }
  ]
}