无法理解MXNET中Julia的char lstm示例
我试图理解这里提到的char lstm示例- 函数lstm_cell接受第二个参数作为前一个状态-无法理解MXNET中Julia的char lstm示例,julia,mxnet,Julia,Mxnet,我试图理解这里提到的char lstm示例- 函数lstm_cell接受第二个参数作为前一个状态- 函数lstm_cell(data::mx.SymbolicNode,prev_state::LSTMState,param::LSTMParam;num_hidden::Int=512,dropout::Real=0,name::Symbol=gensym()) 但是,在部分-#堆栈LSTM单元 next_state=lstm_单元(隐藏,l_状态,l_参数,num_HINDED=dim_HIND
函数lstm_cell(data::mx.SymbolicNode,prev_state::LSTMState,param::LSTMParam;num_hidden::Int=512,dropout::Real=0,name::Symbol=gensym())
但是,在部分-#堆栈LSTM单元 next_state=lstm_单元(隐藏,l_状态,l_参数,num_HINDED=dim_HINDED,dropout=dp,name=Symbol(名称,“lstm$t”))
隐藏=下一个状态。h
图层参数状态[i]=(l参数,下一个状态) 层参数状态[i]将使用下一个状态更新- 层参数状态[i]=(l参数,下一个状态)
为什么在这里这么做。为什么用下一个状态更新上一个状态。因为
层参数状态
存储序列的最终状态。注释在最终状态下是分组的,将使用提供的标签进行丢失
仅供参考,python示例做了完全相同的事情:。名称last_states
更有意义。请使用倒勾(`)引用您的代码。(或者突出显示代码段并单击“{}”按钮。)