Machine learning 如何训练具有不同大小输入的神经网络?

Machine learning 如何训练具有不同大小输入的神经网络?,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我想用不同的声音训练我的神经网络。然而,每个声音的大小是不同的。有人知道如何用不同大小的输入训练神经网络吗?谢谢。没有办法对不同大小的输入进行分类,但您可以将信号转换为固定大小的特征向量序列(或原始声音的固定大小片段序列)。 对于声音,我们通常使用MFCC或仅使用频谱图。因此,您需要应用对序列进行操作的方法。它可以是一个递归神经网络,也可以采用前馈网络,然后以某种方式对每一帧的输出进行后处理。你所说的“每个声音都不同”是什么意思?如果我理解正确,你有一个声音输入,即样本数组,你希望它成为神经网络

我想用不同的声音训练我的神经网络。然而,每个声音的大小是不同的。有人知道如何用不同大小的输入训练神经网络吗?谢谢。

没有办法对不同大小的输入进行分类,但您可以将信号转换为固定大小的特征向量序列(或原始声音的固定大小片段序列)。
对于声音,我们通常使用MFCC或仅使用频谱图。因此,您需要应用对序列进行操作的方法。它可以是一个递归神经网络,也可以采用前馈网络,然后以某种方式对每一帧的输出进行后处理。

你所说的“每个声音都不同”是什么意思?如果我理解正确,你有一个声音输入,即样本数组,你希望它成为神经网络的输入。一种可能的解决方案是提取声音的特征(或部分特征),这将是恒定的值向量。例如,如果要提取语音识别的特征,可以使用MFCC:每个声音的长度不同,这意味着每个标签声音的输入向量大小不同。例如,如果我想训练模型识别声音A、B、C,但是,这三种声音的长度是不同的。如果我想通过原始声音来训练模型,而不是首先通过提取特征来训练它,那该怎么办?我想你可能会有兴趣检查这个:相关的