Machine learning 如何将语音文件输入RNN/LSTM进行语音识别?

Machine learning 如何将语音文件输入RNN/LSTM进行语音识别?,machine-learning,deep-learning,lstm,recurrent-neural-network,Machine Learning,Deep Learning,Lstm,Recurrent Neural Network,我正在研究RNN/LSTM。我用RNN做了一个简单的项目,在这个项目中我将文本输入RNN。但我不知道如何将语音输入RNN,以及如何对循环网络的语音进行预处理。我读过很多媒体和其他网站的文章。但我不能在网络中使用语言。您可以共享任何包含语音和RNN/LSTM的项目,或任何可以帮助我的项目。您需要将原始音频信号转换为频谱图或使用RNN/LSTM更容易处理的其他方便格式。中型博客应该是有帮助的。您可以查看执行情况。我在查看mycroft精确源代码时取得了一些成功。Tensorflow也有一些很好的教程

我正在研究RNN/LSTM。我用RNN做了一个简单的项目,在这个项目中我将文本输入RNN。但我不知道如何将语音输入RNN,以及如何对循环网络的语音进行预处理。我读过很多媒体和其他网站的文章。但我不能在网络中使用语言。您可以共享任何包含语音和RNN/LSTM的项目,或任何可以帮助我的项目。

您需要将原始音频信号转换为频谱图或使用RNN/LSTM更容易处理的其他方便格式。中型博客应该是有帮助的。您可以查看执行情况。

我在查看mycroft精确源代码时取得了一些成功。Tensorflow也有一些很好的教程。我正在寻找FPGA的例子自己。像谷歌的所有工具。当我至少有时间的时候。我不明白我应该以矩阵的形式或者其他什么的形式提供这些特性吗?