Machine learning RNNlib中参数的含义

Machine learning RNNlib中参数的含义,machine-learning,neural-network,Machine Learning,Neural Network,我是研究递归神经网络的新手,现在被RNNLib中的参数弄糊涂了。具体来说,我不了解mdl的隐藏块、隐藏大小、输入块、子样本大小和内容。根据我的经验,我只有输入向量,一个lstm隐藏层和softmax输出层。为什么块看起来像一个矩阵?RNNLib实现了一种新型的RNN,即所谓的“多维递归神经网络”。RNNLib页面上的以下参考说明:Alex Graves、Santiago Fernández和Jürgen Schmidhuber。人工神经网络国际会议,2007年9月,波尔图。此扩展用于处理图像、视

我是研究递归神经网络的新手,现在被RNNLib中的参数弄糊涂了。具体来说,我不了解mdl的隐藏块、隐藏大小、输入块、子样本大小和内容。根据我的经验,我只有输入向量,一个lstm隐藏层和softmax输出层。为什么块看起来像一个矩阵?

RNNLib实现了一种新型的RNN,即所谓的“多维递归神经网络”。RNNLib页面上的以下参考说明:Alex Graves、Santiago Fernández和Jürgen Schmidhuber。人工神经网络国际会议,2007年9月,波尔图。此扩展用于处理图像、视频等。如文件所述:

“MDRNNs的基本思想是取代标准中的单一循环连接 具有与数据中维度相同数量的重复连接的RNN。 在向前传递期间,在数据序列中的每个点,网络的隐藏层 接收一个外部输入和它自己的激活,从一步后退到另一步 “所有尺寸”

我认为,这就是为什么你有能力使用多维输入的原因。如果您想像往常一样使用RNNLib一维RNN,只需为输入和LSTM块指定一个维度


MDL代表“最小描述长度”代价函数,用于逼近贝叶斯推理(一种正则化神经网络的方法)。如果您想使用它,最好阅读RNNLib网站上提供的原始参考资料。否则,我认为,它可以被忽略

由于Graves是rnnlib的作者,因此花时间阅读他的RNN论文是非常值得的。您应该阅读代码以了解
rnnlib
的许多参数。