Machine learning 为什么要展平卷积VAE中的最后一个编码器层?

Machine learning 为什么要展平卷积VAE中的最后一个编码器层?,machine-learning,deep-learning,convolution,autoencoder,unsupervised-learning,Machine Learning,Deep Learning,Convolution,Autoencoder,Unsupervised Learning,我对深度学习游戏很陌生,我想知道为什么我们要在VAE中展平编码器的最后一层,然后将展平的输出提供给线性层,然后线性层近似先前的位置和比例参数?我们不能直接分割卷积层的输出并从这里得到位置和比例,或者卷积捕获的空间信息会弄乱比例和位置吗 非常感谢 为什么我们要在VAE中展平编码器的最后一层? 除了方便打印或报告之外,没有什么好的理由。如果在展平之前编码器的形状为[BatchSize,2,2,32],那么将其展平为[BatchSize,128]就可以方便地列出每个样本的所有128个编码值。然后,当解

我对深度学习游戏很陌生,我想知道为什么我们要在VAE中展平编码器的最后一层,然后将展平的输出提供给线性层,然后线性层近似先前的位置和比例参数?我们不能直接分割卷积层的输出并从这里得到位置和比例,或者卷积捕获的空间信息会弄乱比例和位置吗

非常感谢

为什么我们要在VAE中展平编码器的最后一层? 除了方便打印或报告之外,没有什么好的理由。如果在展平之前编码器的形状为[BatchSize,2,2,32],那么将其展平为[BatchSize,128]就可以方便地列出每个样本的所有128个编码值。然后,当解码器将其重塑为[BatchSize,2,2,32]时,所有空间信息都会放回原来的位置。没有丢失任何空间信息


当然,可以决定使用经过训练的VAE的编码器作为图像特征提取器。当我们有很多未标记的图像来训练VAE,但只有少数标记的图像时,这实际上非常有用。在大型未标记图像集上训练VAE后,编码器有效地成为特征提取器。然后,我们可以将特征提取器输入到一个稠密的层中,该层的目的是学习标签。在这种情况下,让编码器输出平坦的数据集非常有用。

谢谢,安东!这很有帮助:)