Windows 我可以直接使用SAPI将语音从存储的音频实时转换为文本吗

Windows 我可以直接使用SAPI将语音从存储的音频实时转换为文本吗,windows,visual-c++,sapi,Windows,Visual C++,Sapi,我真正想要实现的是--> 假设我播放一个音频文件(使用我的应用程序),该文件可以从internet流式传输或直接从本地存储访问。 现在,我想将SAPI配置为收听此源,而不是麦克风,并像往常一样将语音从音频转换为文本。似乎只支持WAV开箱即用-请参阅 引述: wav文件输入场景非常特殊,因为它使用受控、可复制的音频输入,并且需要专用的SR引擎,而不会受到其他应用程序(例如,共享桌面麦克风)的干扰。文件输入场景应使用连接到输入wav文件的通用SAPI音频流和InProc SR引擎 我认为SAPI本身

我真正想要实现的是--> 假设我播放一个音频文件(使用我的应用程序),该文件可以从internet流式传输或直接从本地存储访问。
现在,我想将SAPI配置为收听此源,而不是麦克风,并像往常一样将语音从音频转换为文本。

似乎只支持WAV开箱即用-请参阅

引述:

wav文件输入场景非常特殊,因为它使用受控、可复制的音频输入,并且需要专用的SR引擎,而不会受到其他应用程序(例如,共享桌面麦克风)的干扰。文件输入场景应使用连接到输入wav文件的通用SAPI音频流和InProc SR引擎


我认为SAPI本身并不支持这一点

您可以使用SAPI“外部”的一些方法:

  • 获取一个音频,并将声卡的输出插入声卡的输入

  • 使用基本上达到#1,但使用虚拟声卡软件而不是硬件。一开始理解虚拟音频电缆的工作原理和使用方法可能会非常棘手,但一旦你弄明白了,它确实可以很好地工作

  • 某些声卡具有内置环回功能,允许您录制声卡播放的内容,而不是从麦克风等处录制。这里有一些很好的信息链接:和。也可以通过谷歌搜索这些术语来获取更多信息