在AGI python中是否有任何方法可以流式传输实时音频以进行语音识别?
我创建了一个python脚本,可以将音频转录成文本,但它使用录制的音频作为输入,问题是在未达到指定时间之前,它是一个记录文件,如下所示在AGI python中是否有任何方法可以流式传输实时音频以进行语音识别?,python,python-3.x,asterisk,agi,Python,Python 3.x,Asterisk,Agi,我创建了一个python脚本,可以将音频转录成文本,但它使用录制的音频作为输入,问题是在未达到指定时间之前,它是一个记录文件,如下所示 exten => 1102,n,Record(file_path,,7) exten => 1102,n,agi(python_script) 这里记录中的7是总持续时间,现在假设如果我像Hello那样只说2秒,那么我接下来的5秒将被浪费,并且没有得到优化 第二,除非记录不完整,否则agi不会启动,它不会在某个地方运行,因为agi脚本使用记录的音频
exten => 1102,n,Record(file_path,,7)
exten => 1102,n,agi(python_script)
这里记录中的7是总持续时间,现在假设如果我像Hello那样只说2秒,那么我接下来的5秒将被浪费,并且没有得到优化
第二,除非记录不完整,否则agi不会启动,它不会在某个地方运行,因为agi脚本使用记录的音频文件作为输入和输出
现在我的主要问题是,如何现场转录音频?是的,我知道还有一些延迟,但这是可以接受的。AGI界面中没有streams操作 您可以使用EAGI或单播应用程序,或者使用audiohooks api在c/c++中编写自己的应用程序