Keras 使用不同大小的样本训练用于说话人识别的LSTM

Keras 使用不同大小的样本训练用于说话人识别的LSTM,keras,lstm,recurrent-neural-network,spectrogram,Keras,Lstm,Recurrent Neural Network,Spectrogram,我尝试使用小块语音作为LSTM的输入,用于识别说话人 问题是每个语音样本的长度不同 作为网络输入的光谱图是具有不同形状的矩阵 我尝试了批量训练,批量大小等于每个光谱图中的帧数(子阵列)。在拟合模型时,我必须传递与光谱图中帧数相同大小的标签向量 所以它基本上是在每一帧上一个接一个地训练,然后丢失时间信息 你有什么建议 如果需要,我可以提供更多详细信息。这是否回答了您的问题?

我尝试使用小块语音作为LSTM的输入,用于识别说话人
问题是每个语音样本的长度不同

作为网络输入的光谱图是具有不同形状的矩阵
我尝试了批量训练,批量大小等于每个光谱图中的帧数(子阵列)。在拟合模型时,我必须传递与光谱图中帧数相同大小的标签向量

所以它基本上是在每一帧上一个接一个地训练,然后丢失时间信息
你有什么建议

如果需要,我可以提供更多详细信息。

这是否回答了您的问题?