Google cloud platform 谷歌语音到文本错误:“quot;无效识别';配置';:错误的编码……”;下载MP3文件
我正在react web应用程序中使用“mic-recorder-to-mp3”节点包录制音频 我使用MediaInfo查看了使用此库()生成的音频文件,它显示了以下信息: 因此,它似乎没有损坏或其他任何东西…但是,当我使用以下代码运行Google的语音到文本API时,我得到了错误:“无效的识别'config':错误的编码…”Google cloud platform 谷歌语音到文本错误:“quot;无效识别';配置';:错误的编码……”;下载MP3文件,google-cloud-platform,speech-recognition,speech-to-text,google-speech-api,google-cloud-speech,Google Cloud Platform,Speech Recognition,Speech To Text,Google Speech Api,Google Cloud Speech,我正在react web应用程序中使用“mic-recorder-to-mp3”节点包录制音频 我使用MediaInfo查看了使用此库()生成的音频文件,它显示了以下信息: 因此,它似乎没有损坏或其他任何东西…但是,当我使用以下代码运行Google的语音到文本API时,我得到了错误:“无效的识别'config':错误的编码…” 我不明白这里出了什么问题……任何帮助都将不胜感激 我能够重现问题,似乎使用的编码是根本原因,我使用了gcloud ml speech recognize命令,但没有得到
我不明白这里出了什么问题……任何帮助都将不胜感激 我能够重现问题,似乎使用的编码是根本原因,我使用了
gcloud ml speech recognize
命令,但没有得到响应:
gcloud ml speech recognize gs://MY_BUCKET/audioClip.mp3 --language-code=en-US --encoding=linear16 --sample-rate=48000
{}
之后,我更改了文件的编码:
ffmpeg -i audioClip.mp3 audioClip.wav
然后我又试了一次,瞧:
gcloud ml speech recognize gs://MY_BUCKET/audioClip.wav --language-code=en-US --encoding=linear16 --sample-rate=48000
{
"results": [
{
"alternatives": [
{
"confidence": 0.7809482,
"transcript": "testing testing 1 2 3"
}
]
}
]
}
请考虑,根据这个MP3编码是一个beta特性,只能在V1P1BETA1中使用。所以,你应该考虑将文件转换成语音到文本API。
我们没有访问文件的发布,有可能公开对我进行测试吗?嗨,恩里克。很抱歉,我刚刚更改了驱动器链接的权限,所以现在应该可以正常工作了。我试过使用另一个麦克风库,它现在正在为我工作,但我认为如果我们能够解决这个问题,它对我和其他人仍然是有用的gcloud ml speech recognize gs://MY_BUCKET/audioClip.wav --language-code=en-US --encoding=linear16 --sample-rate=48000
{
"results": [
{
"alternatives": [
{
"confidence": 0.7809482,
"transcript": "testing testing 1 2 3"
}
]
}
]
}