Audio 直接从音频/转录语音到文本（语音识别）_Audio_Text_Mp3_Speech Recognition_Speech

Audio 直接从音频/转录语音到文本（语音识别）

audio text speech-recognition

Audio 直接从音频/转录语音到文本（语音识别）,audio,text,mp3,speech-recognition,speech,Audio,Text,Mp3,Speech Recognition,Speech,需要能够转换或转录音频（如从MP3，其他音频格式）包含语音到文本转录使用语音到文本（语音识别）算法的高精度语音。有许多可用的方法可以做到这一点，这些方法越来越精确，但都是为设备麦克风中的语音而设计的（例如，Google Translate/对应的web API，用于iOS的Dragon应用程序）。我需要一种将音频文件直接输入语音识别引擎/API的方法。不想通过扬声器播放音频并用麦克风捕捉——长时间播放音频文件需要相当长的时间，并且会降低音频质量和最终的转录质量。是否存在用于此的web服务

需要能够转换或转录音频（如从MP3，其他音频格式）包含语音到文本转录使用语音到文本（语音识别）算法的高精度语音。有许多可用的方法可以做到这一点，这些方法越来越精确，但都是为设备麦克风中的语音而设计的（例如，Google Translate/对应的web API，用于iOS的Dragon应用程序）。我需要一种将音频文件直接输入语音识别引擎/API的方法。不想通过扬声器播放音频并用麦克风捕捉——长时间播放音频文件需要相当长的时间，并且会降低音频质量和最终的转录质量。是否存在用于此的web服务、API或代码？在现有的服务中，是否有一种包装器假定麦克风将是源

感谢

现在有了一项相对较新的服务，允许语音到文本的自动转录，以及一个很好的网络界面，用于人工编辑结果。它是：

我们已经使用了它，并且对结果感到满意。转录当然不是完美的，但这是一个很好的开始，它允许随时进行人工编辑

IBM Bluemix/Watson现在也提供了一个新的API和服务。您可以在此处尝试免费演示：

这项服务在将音频（来自麦克风或音频文件）转换为文本方面做得相当不错。目前，至少在演示中，它似乎不使用MP3，但将使用wav和其他格式。这项服务有一个完整的API，它主要设计为内置到应用程序中。

这里没有主题，但您可以尝试询问，看看我的回答中的链接API-这是如何实现的？或者，如今如何实现这一目标，使用ML或？