tensorflow中RNN和LSTM的实现_Tensorflow_Lstm

tensorflow中RNN和LSTM的实现

tensorflow

tensorflow中RNN和LSTM的实现,tensorflow,lstm,Tensorflow,Lstm,我一直在努力学习如何在tensorflow中编写RNN和LSTM。我在这篇博文的网上找到了一个例子下面是我在理解最终用于字符rnn生成的LSTM网络时遇到的问题 x = tf.placeholder(tf.int32, [batch_size, num_steps], name='input_placeholder') y = tf.placeholder(tf.int32, [batch_size, num_steps], name='labels_placeholder'

我一直在努力学习如何在tensorflow中编写RNN和LSTM。我在这篇博文的网上找到了一个例子

下面是我在理解最终用于字符rnn生成的LSTM网络时遇到的问题

    x = tf.placeholder(tf.int32, [batch_size, num_steps], name='input_placeholder')
    y = tf.placeholder(tf.int32, [batch_size, num_steps], name='labels_placeholder')

    embeddings = tf.get_variable('embedding_matrix', [num_classes, state_size])
    rnn_inputs = [tf.squeeze(i) for i in tf.split(1,
                            num_steps, tf.nn.embedding_lookup(embeddings, x))]

现在代码的不同部分定义了权重 x是要输入的数据，y是标签集。在lstm方程中，我们有一系列的门，x（t）乘以一系列，上一个隐藏状态乘以一组权重，添加偏差，应用非线性

以下是我的疑问

在这种情况下，只定义了一个权重矩阵，这是否意味着适用于x（t）和上一个隐藏状态
对于嵌入矩阵，我知道它必须乘以权重矩阵但为什么第一维度是num_类
对于rnn_输入，我们使用的是去除1维的挤压但我为什么要在一个热编码中这样做呢
同样从拆分中，我了解到我们正在展开将维度（批次大小X数量步数）分为离散维度（批次大小X 1）向量，然后通过网络传递这些值对

tf.nn.rnn\u cell.LSTMCell

state\u size=200

vocab\u size=2000

vocab_大小

状态_大小

tf.nn.rnn

（批大小，输入大小）

（批大小，1，输入大小）

num步数

（批次大小，1，状态大小）

嵌入矩阵将每个单词嵌入为
```
state\u size
```
维度向量（矩阵的一行），使大小
```
（vocab\u size，state\u size）
```
检索由x占位符指定的索引并获取rnn输入，即大小
```
（批大小、步骤数、状态大小）
```

tf.split

将输入拆分为

（批次大小，1，状态大小）

tf.squeeze

squeeze它们到

（批大小、状态大小）

，形成

tf.nn.rnn

所需的输入格式

 with tf.variable_scope('softmax'):
         W = tf.get_variable('W', [state_size, num_classes])
         b = tf.get_variable('b', [num_classes], initializer=tf.constant_initializer(0.0))
 logits = [tf.matmul(rnn_output, W) + b for rnn_output in rnn_outputs]

 y_as_list = [tf.squeeze(i, squeeze_dims=[1]) for i in tf.split(1, num_steps, y)]