Audio 如何在OSX上获得实时转录(没有音频文件)?

Audio 如何在OSX上获得实时转录(没有音频文件)?,audio,speech-recognition,audio-streaming,closed-captions,transcription,Audio,Speech Recognition,Audio Streaming,Closed Captions,Transcription,我正在开发一款应用程序,为那些陷入多余会议的人设计,他们需要知道什么时候有人问他们问题 我的计划是: 将会议音频(通常从我的演讲者中传出)流式传输到speech-to-text程序中 将这些信息流到关注我的名字和/或提高语调的问题中 当有人问我问题时,让程序“叮”。然后我可以快速阅读课文并回答 最难的部分是步骤(1)。我发现的所有语音到文本的程序都接受音频文件作为输入,不能只从任何频道流到扬声器/耳机。另一方面,我发现辅助程序接管了键盘输入。理想情况下,用户可以在会议期间通过键入其他应用程序来完

我正在开发一款应用程序,为那些陷入多余会议的人设计,他们需要知道什么时候有人问他们问题

我的计划是:

  • 将会议音频(通常从我的演讲者中传出)流式传输到speech-to-text程序中
  • 将这些信息流到关注我的名字和/或提高语调的问题中
  • 当有人问我问题时,让程序“叮”。然后我可以快速阅读课文并回答
  • 最难的部分是步骤(1)。我发现的所有语音到文本的程序都接受音频文件作为输入,不能只从任何频道流到扬声器/耳机。另一方面,我发现辅助程序接管了键盘输入。理想情况下,用户可以在会议期间通过键入其他应用程序来完成富有成效的工作,因此这种解决方案不会起作用

    因此,我正在寻找可以在OSX上使用的东西,它可以处理step(1),或者更好地为我完成上面的大部分步骤


    我已经对解决方案进行了研究,但在步骤(1)中找不到任何解决方案。我之所以包括其他步骤,是因为可能会有一个更具创造性的解决方案(例如一些不用于听写的其他辅助技术)我不知道。

    您可以使用许多API,例如,它不是完全免费的

    如果你容忍较低的精确度,你可以使用开源软件,比如


    问题还在于如何从voip软件中获取音频流,你必须自己破解它。或者您必须重新录制扬声器上播放的内容,这并不总是一个好主意。

    您可以使用许多API,例如,它不是完全免费的

    如果你容忍较低的精确度,你可以使用开源软件,比如

    问题还在于如何从voip软件中获取音频流,你必须自己破解它。或者你必须重新录制扬声器上播放的内容,这并不总是一个好主意。

    1)我使用了应用程序间音频路由,本质上是一个虚拟混音器,将音频从一个应用程序传输到另一个应用程序。它显示为一个音频输入设备,还允许监控-所以你可以收听以及流到另一个应用程序

    2和3)这两个方面不是我的专业领域,但我可能会调查任何谷歌API(正如尼古拉所说)来开始我的研究。

    1)我曾用于应用程序间音频路由,本质上是一个虚拟混音器,将音频从一个应用程序传输到另一个应用程序。它显示为一个音频输入设备,还允许监控-所以你可以收听以及流到另一个应用程序

    2和3)并不是我的专业领域,但我可能会调查任何谷歌API(正如尼古拉所说)来开始我的研究