Python中的实时语音到文本转录

Python中的实时语音到文本转录,python,raspberry-pi,speech-recognition,ibm-watson,Python,Raspberry Pi,Speech Recognition,Ibm Watson,这是我的第一篇文章,所以我希望它是好的。 我正在制作一个树莓皮零W,我正在尝试对文本翻译进行现场演讲。我已经研究过了,我认为我需要使用SpeechRecognition模块,我一直在做这件事,最后我确实编写了一个程序,它可以实现我所需要的功能,可以使用Google语音到文本模块,而这项工作并不是实时的。 我想,为了让它能够现场转录,我需要使用IBMWatson的语音,通过Websockets进行文本转换 我似乎找不到关于这两个方面的很多信息,但仅仅是任何代码,如果你们中的任何人有使用Python

这是我的第一篇文章,所以我希望它是好的。 我正在制作一个树莓皮零W,我正在尝试对文本翻译进行现场演讲。我已经研究过了,我认为我需要使用SpeechRecognition模块,我一直在做这件事,最后我确实编写了一个程序,它可以实现我所需要的功能,可以使用Google语音到文本模块,而这项工作并不是实时的。 我想,为了让它能够现场转录,我需要使用IBMWatson的语音,通过Websockets进行文本转换


我似乎找不到关于这两个方面的很多信息,但仅仅是任何代码,如果你们中的任何人有使用Python的这种或任何其他方式将live转录为文本的经验,如果您能为我指出正确的方向,我将非常感激,而且任何代码都会很棒。

谷歌拥有实时语音到文本转录API。它们还提供源代码,让您开始使用它。看看这个。它所做的只是听你的麦克风,并实时向你发送你所说的任何内容的文本版本

这是一个开箱即用的示例软件。您只需使用保存在您的应用程序中的
GOOGLE\u应用程序\u凭据运行即可

如果您已经使用过一次,您应该已经设置了一个帐单帐户。如果没有,请这样做