Speech to text 单通道音频文件的音频通道计数无效
我有一个wav音频文件,我已经将其转换为单声道,并进一步转换为FLAC音频格式 声音=音频段。来自_wav(“/Users/tcssig/Downloads/sample.wav”) 声道 一, request.json API请求 使用google speech to text api生成成绩单,它会给出错误响应:Speech to text 单通道音频文件的音频通道计数无效,speech-to-text,google-speech-api,Speech To Text,Google Speech Api,我有一个wav音频文件,我已经将其转换为单声道,并进一步转换为FLAC音频格式 声音=音频段。来自_wav(“/Users/tcssig/Downloads/sample.wav”) 声道 一, request.json API请求 使用google speech to text api生成成绩单,它会给出错误响应: {'error': {'code': 400, 'message': 'Invalid audio channel count', 'status': 'INVALID_A
{'error': {'code': 400,
'message': 'Invalid audio channel count',
'status': 'INVALID_ARGUMENT'}}
由于API支持单声道而非立体声声道,我无法理解为什么FLAC格式的单声道文件会出现这种情况。看起来音频文件不是单声道的。如果您无法检查自己,请共享该文件。是的,这就是原因,但我使用sound.channels命令在python中检查了该文件,它显示了单通道。后来我使用基于gui的工具将其转换为FLAC单声道文件,并正确地通过了。看起来音频文件不是单声道的。如果您无法检查自己,请共享该文件。是的,这就是原因,但我使用sound.channels命令在python中检查了该文件,它显示了单通道。后来,我使用基于gui的工具将其转换为FLAC单通道文件,并正确地完成了转换。
import requests
headers = {
'Content-Type': 'application/json',
}
params = (
('key', '****************************'),
)
data = open('/Users/tcssig/Documents/request.json', 'rb').read()
response = requests.post('https://speech.googleapis.com/v1/speech:longrunningrecognize', headers=headers, params=params, data=data)
{'error': {'code': 400,
'message': 'Invalid audio channel count',
'status': 'INVALID_ARGUMENT'}}