Python 如何解释tensorflow模型摘要中打印的输出形状?
我有简单的多层感知器用于MNIST数据分类问题Python 如何解释tensorflow模型摘要中打印的输出形状?,python,tensorflow,Python,Tensorflow,我有简单的多层感知器用于MNIST数据分类问题 model = tf.keras.Sequential([ tf.keras.layers.Flatten(), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dense(10, activation='softmax') ]) 打印摘要时,我收到以下输出: _________________________________________________
model = tf.keras.Sequential([
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dense(10, activation='softmax')
])
打印摘要时,我收到以下输出:
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
flatten_8 (Flatten) (None, 784) 0
_________________________________________________________________
dense_16 (Dense) (None, 128) 100480
_________________________________________________________________
dense_17 (Dense) (None, 10) 1290
=================================================================
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________
如何解释摘要中打印的输出形状?为什么输出形状元组中没有therm?为什么不只是(784)在第一层?无”值指的是输入样本的数量(批量大小)。要允许您在不同大小的训练集上进行训练,此值为“无”。如果它是一个数字,比如说50,这意味着你只能训练50个样本,这通常不是很有用(但偶尔也有应用程序)