使用Python实时将语音转换为文本

使用Python实时将语音转换为文本,python,speech-recognition,pyaudio,Python,Speech Recognition,Pyaudio,我目前正在尝试创建一个程序,将通过麦克风输入的内容打印到控制台中,而不是在用户说完他们想说的话后的一个大区块中。如何扩展SpeechRecognition/PyAudio模块以实现这一点。我认为这可能涉及到检测某人何时说完一个词,然后循环回到语音检测,但我不确定如何实现这一点 为了在用户结束讲话后打印文本,这只是一个基本示例: microphone = sr.Microphone(device_index=0) r = sr.Recognizer() with microphone as sou

我目前正在尝试创建一个程序,将通过麦克风输入的内容打印到控制台中,而不是在用户说完他们想说的话后的一个大区块中。如何扩展SpeechRecognition/PyAudio模块以实现这一点。我认为这可能涉及到检测某人何时说完一个词,然后循环回到语音检测,但我不确定如何实现这一点

为了在用户结束讲话后打印文本,这只是一个基本示例:

microphone = sr.Microphone(device_index=0)
r = sr.Recognizer()
with microphone as source:
    audio = r.listen(source)
print(r.recognize_google(audio))

谢谢:)

谢谢你,尼古拉!该API似乎正是我的项目所需要的谢谢你,尼古拉!该API似乎正是我的项目所需要的