Machine learning 基于GAN的合成手写字数据生成

Machine learning 基于GAN的合成手写字数据生成,machine-learning,keras,deep-learning,computer-vision,handwriting-recognition,Machine Learning,Keras,Deep Learning,Computer Vision,Handwriting Recognition,我正在尝试生成合成手写数据。我偶然发现GAN被用来生成单个字符的图像 生成器:将随机张量向上采样到图像 鉴别器:使用真实数据对真实/生成的数据进行分类 但我们无法控制需要哪种字符输出 我有一个包含单词图像(IAM)的手写数据集 如果对于单词级别,每个单词是否需要单独的GAN 我需要将输出图像注释为单词(用于单词识别) 有没有输出文字合成手写图像的GAN网络,而不是在训练数据集中?您使用的GAN网络有两部分: 生成器:它将随机噪声伪造成图像。利用鉴别器产生的损耗对其进行训练 鉴别器:它区分真实图

我正在尝试生成合成手写数据。我偶然发现GAN被用来生成单个字符的图像

生成器:将随机张量向上采样到图像

鉴别器:使用真实数据对真实/生成的数据进行分类

但我们无法控制需要哪种字符输出

我有一个包含单词图像(IAM)的手写数据集

如果对于单词级别,每个单词是否需要单独的GAN

我需要将输出图像注释为单词(用于单词识别)


有没有输出文字合成手写图像的GAN网络,而不是在训练数据集中?

您使用的GAN网络有两部分:

  • 生成器:它将随机噪声伪造成图像。利用鉴别器产生的损耗对其进行训练

  • 鉴别器:它区分真实图像和预测图像。因此,计算损失

鉴别器匹配真实图像和预测图像。如果我向鉴别器显示字符“2”的图像,那么它会将预测与该图像进行比较。因此,将计算损耗,发电机将从该损耗中学习

因此,如果显示字符“3”的图像,则生成器将尝试生成字符“3”的图像,以便愚弄鉴别器

通过向生成器提供不同的图像,您可以将随机噪声伪造成任何所需的输出。