Machine learning 为什么要展平卷积VAE中的最后一个编码器层？_Machine Learning_Deep Learning_Convolution_Autoencoder_Unsupervised Learning

Machine learning 为什么要展平卷积VAE中的最后一个编码器层？

machine-learning deep-learning

Machine learning 为什么要展平卷积VAE中的最后一个编码器层？,machine-learning,deep-learning,convolution,autoencoder,unsupervised-learning,Machine Learning,Deep Learning,Convolution,Autoencoder,Unsupervised Learning,我对深度学习游戏很陌生，我想知道为什么我们要在VAE中展平编码器的最后一层，然后将展平的输出提供给线性层，然后线性层近似先前的位置和比例参数？我们不能直接分割卷积层的输出并从这里得到位置和比例，或者卷积捕获的空间信息会弄乱比例和位置吗非常感谢为什么我们要在VAE中展平编码器的最后一层？除了方便打印或报告之外，没有什么好的理由。如果在展平之前编码器的形状为[BatchSize，2,2,32]，那么将其展平为[BatchSize，128]就可以方便地列出每个样本的所有128个编码值。然后，当解

我对深度学习游戏很陌生，我想知道为什么我们要在VAE中展平编码器的最后一层，然后将展平的输出提供给线性层，然后线性层近似先前的位置和比例参数？我们不能直接分割卷积层的输出并从这里得到位置和比例，或者卷积捕获的空间信息会弄乱比例和位置吗

非常感谢

为什么我们要在VAE中展平编码器的最后一层？除了方便打印或报告之外，没有什么好的理由。如果在展平之前编码器的形状为[BatchSize，2,2,32]，那么将其展平为[BatchSize，128]就可以方便地列出每个样本的所有128个编码值。然后，当解码器将其重塑为[BatchSize，2,2,32]时，所有空间信息都会放回原来的位置。没有丢失任何空间信息

当然，可以决定使用经过训练的VAE的编码器作为图像特征提取器。当我们有很多未标记的图像来训练VAE，但只有少数标记的图像时，这实际上非常有用。在大型未标记图像集上训练VAE后，编码器有效地成为特征提取器。然后，我们可以将特征提取器输入到一个稠密的层中，该层的目的是学习标签。在这种情况下，让编码器输出平坦的数据集非常有用。

谢谢，安东！这很有帮助：）