Audio 如何将linear16文本转换为语音并转换为音频文件_Audio_Encoding_Text To Speech_Google Text To Speech

Audio 如何将linear16文本转换为语音并转换为音频文件

audio encoding

Audio 如何将linear16文本转换为语音并转换为音频文件,audio,encoding,text-to-speech,google-text-to-speech,Audio,Encoding,Text To Speech,Google Text To Speech,我刚开始玩谷歌文本到语音API。我生成了一个post请求： https://texttospeech.googleapis.com/v1/text:synthesize?fields=audioContent&key={YOUR_API_KEY} 使用以下数据： { "input": { "text": "Hola esto es una prueba" }, "voice": { "languageCode": "es-419" }, "audioConfig": {

我刚开始玩谷歌文本到语音API。我生成了一个post请求：

https://texttospeech.googleapis.com/v1/text:synthesize?fields=audioContent&key={YOUR_API_KEY}

使用以下数据：

{
 "input": {
  "text": "Hola esto es una prueba"
},
 "voice": {
  "languageCode": "es-419"
 },
 "audioConfig": {
  "audioEncoding": "LINEAR16",
  "speakingRate": 1,
  "pitch": 0
 }
}

我得到了200条回复，内容如下：

{
    "audioContent" : "UklGRn6iCwBXQVZFZm10I...(super long string)"
}

我假设这是编码的（或解码的，不确定命名），但我想听听“音频内容”是什么。

如前所述，响应确实是Base64。为了实际收听音频，我将base64编码字符串粘贴到一个文件中，然后运行：

base64 -d audio.txt > audio.wav

这就成功了。

说

audioContent

的值是“base64编码字符串”。我将此作为评论发布，因为我不确定您的问题是否仅限于此。另外，如果你想知道解码方法，你能添加你正在使用的语言的标签吗？