Machine learning 语音文本识别

Machine learning 语音文本识别,machine-learning,speech-recognition,speech-to-text,Machine Learning,Speech Recognition,Speech To Text,例如,在使用移动设备收听有声读物时,是否可以在不使用麦克风的情况下将mp3文件转换为文本?我在IBM Watson中寻找相关的API,但找不到解决方案。在android上没有好的/直接的方法获取音频输出。 对于语音到文本的转换,您可以使用谷歌API 如果你有mp3,用谷歌API把它转换成文本应该没有问题 谷歌有一个从谷歌云语音到文本文档的好方法:实时流媒体或预录音频支持音频输入可以从应用程序的麦克风流媒体传输,也可以从预录音频文件(内联或通过谷歌云存储)发送。支持多种音频编码,包括FLAC、A

例如,在使用移动设备收听有声读物时,是否可以在不使用麦克风的情况下将mp3文件转换为文本?我在IBM Watson中寻找相关的API,但找不到解决方案。

在android上没有好的/直接的方法获取音频输出。

对于语音到文本的转换,您可以使用谷歌API

如果你有mp3,用谷歌API把它转换成文本应该没有问题


谷歌有一个从谷歌云语音到文本文档的好方法:实时流媒体或预录音频支持音频输入可以从应用程序的麦克风流媒体传输,也可以从预录音频文件(内联或通过谷歌云存储)发送。支持多种音频编码,包括FLAC、AMR、PCMU和Linear-16。@PatrickSturm谢谢