Python 需要为Keras中的ASR提供建议
我试图从相应的音频片段中预测一个单词。 我想也许seq2seq模型是合适的,所以我尝试了一下。我试过这两种方法——还有一种。我修改了示例,将光谱图和单词作为X,Y对。但是结果非常糟糕,我无法调试任何东西 即使使用注意力模型也没有结果 如果有人能给我指出正确的方向,我将不胜感激。也许有一种架构更适合这个任务Python 需要为Keras中的ASR提供建议,python,tensorflow,keras,Python,Tensorflow,Keras,我试图从相应的音频片段中预测一个单词。 我想也许seq2seq模型是合适的,所以我尝试了一下。我试过这两种方法——还有一种。我修改了示例,将光谱图和单词作为X,Y对。但是结果非常糟糕,我无法调试任何东西 即使使用注意力模型也没有结果 如果有人能给我指出正确的方向,我将不胜感激。也许有一种架构更适合这个任务