Ffmpeg Google语音到文本api正在将.flac文件部分转换为文本
以下步骤:Ffmpeg Google语音到文本api正在将.flac文件部分转换为文本,ffmpeg,google-cloud-platform,speech-to-text,Ffmpeg,Google Cloud Platform,Speech To Text,以下步骤: 使用ffmpeg将.mp3转换为.flac 运行此命令 gs://xxx/xxx.flac--language code=en-US--async--encoding=flac--sample rate=44100 处理后,以JSON格式显示结果,但与音频文件无关 JSON结果如下所示: { "@type": "xxx", "results": [ { "alternatives": [ { "confidence":
gs://xxx/xxx.flac--language code=en-US--async--encoding=flac--sample rate=44100
李>
{
"@type": "xxx",
"results": [
{
"alternatives": [
{
"confidence": 0.71890223,
"transcript": "I reports everybody."
}
]
},
{
"alternatives": [
{
"confidence": 0.5876879,
"transcript": "dear, it's your"
}
]
}
......
}]}
有人能帮我弄清楚为什么不能正确转换音频文件吗?我丢了标签吗 你发布了整个命令吗?检查“我可以看到以下示例”中不到60秒的音频文件:
gcloud ml speech recognize'gs://cloud samples tests/speech/brooklyn.flac'--language code='en-US'--async
Hi,使用ffmpeg时我遇到了同样的问题。当我使用soundconverter时,一切都很好。我发现ffmpeg的最佳参数是:-压缩级别0-lpc类型无-ac 1-ar 48k-最小分区顺序4-最大分区顺序4,但是使用SoundConverter仍然更好我已经找到了另一种使用ffmpeg的方法-首先将mp3转换为wave:ffmpeg-i file.mp3-ar 48000-ac 1 file.wav,然后将wave转换为flac:ffmpeg-i file.wav file.flac谷歌服务的转录现在比其他triesThanks@Max更好,我们将尝试这个方法