Conv neural network 通过MFCC方法提取特征后,将这些特征作为模型的输入,以光谱图或。。?

Conv neural network 通过MFCC方法提取特征后,将这些特征作为模型的输入,以光谱图或。。?,conv-neural-network,mfcc,Conv Neural Network,Mfcc,我想知道模型的输入是频谱图还是2d阵列?什么模型的输入?MFCC不是频谱图,而是2d-CNN模型的(Mel频率)倒谱系数输入。是否可以将提取的系数直接用作输入,或者将其更改为频谱图,然后将其用作2D CNN的输入?可以将MFCC用于2D CNN。但mel频谱图在2D CNN上表现更好。MFCC通常与RNN结合使用,主要用于语音,而不是音乐或其他类型的音频任务。谢谢您的回答。我想知道的。

我想知道模型的输入是频谱图还是2d阵列?

什么模型的输入?MFCC不是频谱图,而是2d-CNN模型的(Mel频率)倒谱系数输入。是否可以将提取的系数直接用作输入,或者将其更改为频谱图,然后将其用作2D CNN的输入?可以将MFCC用于2D CNN。但mel频谱图在2D CNN上表现更好。MFCC通常与RNN结合使用,主要用于语音,而不是音乐或其他类型的音频任务。谢谢您的回答。我想知道的。