Ffmpeg Google语音到文本api正在将.flac文件部分转换为文本

Ffmpeg Google语音到文本api正在将.flac文件部分转换为文本,ffmpeg,google-cloud-platform,speech-to-text,Ffmpeg,Google Cloud Platform,Speech To Text,以下步骤: 使用ffmpeg将.mp3转换为.flac 运行此命令 gs://xxx/xxx.flac--language code=en-US--async--encoding=flac--sample rate=44100 处理后,以JSON格式显示结果,但与音频文件无关 JSON结果如下所示: { "@type": "xxx", "results": [ { "alternatives": [ { "confidence":

以下步骤:

  • 使用ffmpeg将.mp3转换为.flac
  • 运行此命令
    gs://xxx/xxx.flac--language code=en-US--async--encoding=flac--sample rate=44100
  • 处理后,以JSON格式显示结果,但与音频文件无关 JSON结果如下所示:

    {
      "@type": "xxx",
      "results": [
        {
          "alternatives": [
            {
              "confidence": 0.71890223,
              "transcript": "I reports everybody."
            }
          ]
        },
        {
          "alternatives": [
            {
              "confidence": 0.5876879,
              "transcript": "dear, it's your"
            }
          ]
        }
    ......
    }]}
    

    有人能帮我弄清楚为什么不能正确转换音频文件吗?我丢了标签吗

    你发布了整个命令吗?检查“我可以看到以下示例”中不到60秒的音频文件:
    gcloud ml speech recognize'gs://cloud samples tests/speech/brooklyn.flac'--language code='en-US'--async
    Hi,使用ffmpeg时我遇到了同样的问题。当我使用soundconverter时,一切都很好。我发现ffmpeg的最佳参数是:-压缩级别0-lpc类型无-ac 1-ar 48k-最小分区顺序4-最大分区顺序4,但是使用SoundConverter仍然更好我已经找到了另一种使用ffmpeg的方法-首先将mp3转换为wave:ffmpeg-i file.mp3-ar 48000-ac 1 file.wav,然后将wave转换为flac:ffmpeg-i file.wav file.flac谷歌服务的转录现在比其他triesThanks@Max更好,我们将尝试这个方法