Python 智能语音识别

Python 智能语音识别,python,wit.ai,Python,Wit.ai,我正在尝试将ogg格式的音频提交给。我需要接收语音的文本表示。当我通过curl请求提交代码时,它返回空响应作为{“\u text”:““entities”:”}。我也试着用pywit来执行它。代码如下: from wit import Wit client = Wit('XXXXXXXXXXXXXXXXX') with open('2.ogg', 'rb') as f: print(f) resp = client.post_speech(f, content_type='au

我正在尝试将ogg格式的音频提交给。我需要接收语音的文本表示。当我通过curl请求提交代码时,它返回空响应作为
{“\u text”:““entities”:”}
。我也试着用pywit来执行它。代码如下:

from wit import Wit

client = Wit('XXXXXXXXXXXXXXXXX')
with open('2.ogg', 'rb') as f:
    print(f)
    resp = client.post_speech(f, content_type='audio/ogg')

print('Yay, got Wit.ai response: ' + str(resp))
我的猜测是该文件没有被捕获,但print显示
\u io.BufferedReader name='2.ogg'
,这意味着该文件存储在缓冲区中,但wit ai拒绝转录它


为什么wit会用空的
\u text

不确定为什么,但问题只会发生在OGG文件上,即使文档说明它可以使用此文件扩展名。因此,我必须将音频转换为WAV,然后再试一次。这次它运行得非常好。

这似乎不是一个编程问题。我问的是与API相关的问题,以及它是如何工作的,我解释了我的尝试和猜测。为什么这不是一个编程问题?我有同样的问题,即使是wav文件。大多数情况下,它都能工作,但有时它只是不断返回空文本和实体。。