Machine learning 如何训练具有不同大小输入的神经网络？_Machine Learning_Neural Network_Conv Neural Network

Machine learning 如何训练具有不同大小输入的神经网络？

machine-learning neural-network

Machine learning 如何训练具有不同大小输入的神经网络？,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我想用不同的声音训练我的神经网络。然而，每个声音的大小是不同的。有人知道如何用不同大小的输入训练神经网络吗？谢谢。没有办法对不同大小的输入进行分类，但您可以将信号转换为固定大小的特征向量序列（或原始声音的固定大小片段序列）。对于声音，我们通常使用MFCC或仅使用频谱图。因此，您需要应用对序列进行操作的方法。它可以是一个递归神经网络，也可以采用前馈网络，然后以某种方式对每一帧的输出进行后处理。你所说的“每个声音都不同”是什么意思？如果我理解正确，你有一个声音输入，即样本数组，你希望它成为神经网络

我想用不同的声音训练我的神经网络。然而，每个声音的大小是不同的。有人知道如何用不同大小的输入训练神经网络吗？谢谢。

没有办法对不同大小的输入进行分类，但您可以将信号转换为固定大小的特征向量序列（或原始声音的固定大小片段序列）。

对于声音，我们通常使用MFCC或仅使用频谱图。因此，您需要应用对序列进行操作的方法。它可以是一个递归神经网络，也可以采用前馈网络，然后以某种方式对每一帧的输出进行后处理。

你所说的“每个声音都不同”是什么意思？如果我理解正确，你有一个声音输入，即样本数组，你希望它成为神经网络的输入。一种可能的解决方案是提取声音的特征（或部分特征），这将是恒定的值向量。例如，如果要提取语音识别的特征，可以使用MFCC：每个声音的长度不同，这意味着每个标签声音的输入向量大小不同。例如，如果我想训练模型识别声音A、B、C，但是，这三种声音的长度是不同的。如果我想通过原始声音来训练模型，而不是首先通过提取特征来训练它，那该怎么办？我想你可能会有兴趣检查这个：相关的