Speech to text 单通道音频文件的音频通道计数无效_Speech To Text_Google Speech Api

Speech to text 单通道音频文件的音频通道计数无效

Speech to text 单通道音频文件的音频通道计数无效,speech-to-text,google-speech-api,Speech To Text,Google Speech Api,我有一个wav音频文件，我已经将其转换为单声道，并进一步转换为FLAC音频格式声音=音频段。来自_wav（“/Users/tcssig/Downloads/sample.wav”）声道一, request.json API请求使用google speech to text api生成成绩单，它会给出错误响应： {'error': {'code': 400, 'message': 'Invalid audio channel count', 'status': 'INVALID_A

我有一个wav音频文件，我已经将其转换为单声道，并进一步转换为FLAC音频格式

声音=音频段。来自_wav（“/Users/tcssig/Downloads/sample.wav”）

声道一,

request.json API请求使用google speech to text api生成成绩单，它会给出错误响应：

{'error': {'code': 400,
  'message': 'Invalid audio channel count',
  'status': 'INVALID_ARGUMENT'}}

由于API支持单声道而非立体声声道，我无法理解为什么FLAC格式的单声道文件会出现这种情况。

看起来音频文件不是单声道的。如果您无法检查自己，请共享该文件。是的，这就是原因，但我使用sound.channels命令在python中检查了该文件，它显示了单通道。后来我使用基于gui的工具将其转换为FLAC单声道文件，并正确地通过了。看起来音频文件不是单声道的。如果您无法检查自己，请共享该文件。是的，这就是原因，但我使用sound.channels命令在python中检查了该文件，它显示了单通道。后来，我使用基于gui的工具将其转换为FLAC单通道文件，并正确地完成了转换。

import requests

headers = {
    'Content-Type': 'application/json',
}

params = (
    ('key', '****************************'),
)

data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)

{'error': {'code': 400,
  'message': 'Invalid audio channel count',
  'status': 'INVALID_ARGUMENT'}}