Audio 直接从音频/转录语音到文本(语音识别)

Audio 直接从音频/转录语音到文本(语音识别),audio,text,mp3,speech-recognition,speech,Audio,Text,Mp3,Speech Recognition,Speech,需要能够转换或转录音频(如从MP3,其他音频格式)包含语音到文本转录使用语音到文本(语音识别)算法的高精度语音。 有许多可用的方法可以做到这一点,这些方法越来越精确,但都是为设备麦克风中的语音而设计的(例如,Google Translate/对应的web API,用于iOS的Dragon应用程序)。 我需要一种将音频文件直接输入语音识别引擎/API的方法。 不想通过扬声器播放音频并用麦克风捕捉——长时间播放音频文件需要相当长的时间,并且会降低音频质量和最终的转录质量。 是否存在用于此的web服务

需要能够转换或转录音频(如从MP3,其他音频格式)包含语音到文本转录使用语音到文本(语音识别)算法的高精度语音。 有许多可用的方法可以做到这一点,这些方法越来越精确,但都是为设备麦克风中的语音而设计的(例如,Google Translate/对应的web API,用于iOS的Dragon应用程序)。 我需要一种将音频文件直接输入语音识别引擎/API的方法。 不想通过扬声器播放音频并用麦克风捕捉——长时间播放音频文件需要相当长的时间,并且会降低音频质量和最终的转录质量。 是否存在用于此的web服务、API或代码?在现有的服务中,是否有一种包装器假定麦克风将是源


感谢

现在有了一项相对较新的服务,允许语音到文本的自动转录,以及一个很好的网络界面,用于人工编辑结果。它是:

我们已经使用了它,并且对结果感到满意。转录当然不是完美的,但这是一个很好的开始,它允许随时进行人工编辑

IBM Bluemix/Watson现在也提供了一个新的API和服务。您可以在此处尝试免费演示:


这项服务在将音频(来自麦克风或音频文件)转换为文本方面做得相当不错。目前,至少在演示中,它似乎不使用MP3,但将使用wav和其他格式。这项服务有一个完整的API,它主要设计为内置到应用程序中。

这里没有主题,但您可以尝试询问,看看我的回答中的链接API-这是如何实现的?或者,如今如何实现这一目标,使用ML或?