Neural network Pybrain中的单词分类:输入向量中不同数量的序列

Neural network Pybrain中的单词分类:输入向量中不同数量的序列,neural-network,pybrain,Neural Network,Pybrain,我正在尝试使用PyBrain实现一个简单的单位数分类器。我有许多数字0到9的记录示例的训练数据,并为每个示例编写了提取MFCC的脚本。为了保持简单(目前),我只计算了13个系数,并且每10毫秒对音频文件进行一次采样。由于每个记录的训练示例具有不同的持续时间,例如,所有“零”集合的样本数量根据音频的持续时间而变化。因此,对于“零”的一些示例,我有一个形状为(67,13)的MFCC训练向量,而对于其他示例,它可能是(44,13) 问题在于,在PyBrain中创建数据集时,输入向量的维度必须一致,并且

我正在尝试使用PyBrain实现一个简单的单位数分类器。我有许多数字0到9的记录示例的训练数据,并为每个示例编写了提取MFCC的脚本。为了保持简单(目前),我只计算了13个系数,并且每10毫秒对音频文件进行一次采样。由于每个记录的训练示例具有不同的持续时间,例如,所有“零”集合的样本数量根据音频的持续时间而变化。因此,对于“零”的一些示例,我有一个形状为(67,13)的MFCC训练向量,而对于其他示例,它可能是(44,13)

问题在于,在PyBrain中创建数据集时,输入向量的维度必须一致,并且应该包含与列相同的行数

是否有某种方法定义数据集,使输入向量具有一定数量的列(13个MFCC),但行数可变(取决于从信号中采集的样本数)?还是我完全错了


我已经在网上和堆栈溢出上搜索了又搜索,但没有找到答案。我可以遵循并实现教程中的Pybrain示例

D'oh。显然,我需要使用特定数字的所有向量来估计多维概率密度函数

你解决问题了吗?我正在为同样的问题寻找解决方案。