Machine learning 基于GAN的合成手写字数据生成_Machine Learning_Keras_Deep Learning_Computer Vision_Handwriting Recognition

Machine learning 基于GAN的合成手写字数据生成

machine-learning keras deep-learning computer-vision

Machine learning 基于GAN的合成手写字数据生成,machine-learning,keras,deep-learning,computer-vision,handwriting-recognition,Machine Learning,Keras,Deep Learning,Computer Vision,Handwriting Recognition,我正在尝试生成合成手写数据。我偶然发现GAN被用来生成单个字符的图像生成器：将随机张量向上采样到图像鉴别器：使用真实数据对真实/生成的数据进行分类但我们无法控制需要哪种字符输出我有一个包含单词图像（IAM）的手写数据集如果对于单词级别，每个单词是否需要单独的GAN 我需要将输出图像注释为单词（用于单词识别）有没有输出文字合成手写图像的GAN网络，而不是在训练数据集中？您使用的GAN网络有两部分：生成器：它将随机噪声伪造成图像。利用鉴别器产生的损耗对其进行训练鉴别器：它区分真实图

我正在尝试生成合成手写数据。我偶然发现GAN被用来生成单个字符的图像

生成器：将随机张量向上采样到图像

鉴别器：使用真实数据对真实/生成的数据进行分类

但我们无法控制需要哪种字符输出

我有一个包含单词图像（IAM）的手写数据集

如果对于单词级别，每个单词是否需要单独的GAN

我需要将输出图像注释为单词（用于单词识别）

有没有输出文字合成手写图像的GAN网络，而不是在训练数据集中？

您使用的GAN网络有两部分：

生成器：它将随机噪声伪造成图像。利用鉴别器产生的损耗对其进行训练
鉴别器：它区分真实图像和预测图像。因此，计算损失

鉴别器匹配真实图像和预测图像。如果我向鉴别器显示字符“2”的图像，那么它会将预测与该图像进行比较。因此，将计算损耗，发电机将从该损耗中学习

因此，如果显示字符“3”的图像，则生成器将尝试生成字符“3”的图像，以便愚弄鉴别器

通过向生成器提供不同的图像，您可以将随机噪声伪造成任何所需的输出。