Neural network 在使用TensorFlow训练MNIST后,我们如何识别真实图像上的文本?

Neural network 在使用TensorFlow训练MNIST后,我们如何识别真实图像上的文本?,neural-network,deep-learning,tensorflow,conv-neural-network,Neural Network,Deep Learning,Tensorflow,Conv Neural Network,我刚刚运行了用于训练MNIST模型的代码。我们如何应用它来识别真实图像中的笔迹? 我是个新手,刚刚开始学习这部分。我已经搜索了,但找不到有关此的信息。这取决于您的具体任务。MNIST模型可以对字符数字进行分类,因此这就是您需要输入的数据 如果您坚持使用MNIST模型(RNN是大多数OCR使用的更好的选择),一种方法是在手写文本图像上运行滑动窗口,并创建模型预测的字符的文本文件。但这也带来了一系列挑战,比如新颖性检测和滑动窗口大小。你必须考虑到MNIST数据集在很大程度上是一个“玩具数据集”,它只

我刚刚运行了用于训练MNIST模型的代码。我们如何应用它来识别真实图像中的笔迹?
我是个新手,刚刚开始学习这部分。我已经搜索了,但找不到有关此的信息。

这取决于您的具体任务。MNIST模型可以对字符数字进行分类,因此这就是您需要输入的数据


如果您坚持使用MNIST模型(RNN是大多数OCR使用的更好的选择),一种方法是在手写文本图像上运行滑动窗口,并创建模型预测的字符的文本文件。但这也带来了一系列挑战,比如新颖性检测和滑动窗口大小。你必须考虑到MNIST数据集在很大程度上是一个“玩具数据集”,它只是图像识别的“Hello world!”,因此,它对现实生活中的问题不是很有用。如果你重新创建训练图像并尝试预测,你会得到好的结果,但同样,这不是一个现实生活中的问题,但可能是一个有趣的项目开始

话虽如此,也许你还不熟悉特征提取,现代卷积神经网络使用的一种技术。利用它,也许你可以从MNIST训练的模型中得到一些有用的东西。从这个意义上说会很有帮助。为了进一步了解这项技术,我强烈推荐


希望能有所帮助

神经网络本质上非常擅长识别你喂给它的“东西”。对于MNIST示例,您正在向它提供大量手写数字的28x28x1图像


因此,作为扩展,如果您想使用完全相同的手写模型(我假设您现在指的是A-Z中的字符),则必须向其提供大量28x28x1手写字符图像。

您尝试了什么?MNIST集合训练模型识别固定大小(模型输入大小)图像中的单个字符。它可以在相同大小的未知图像中找到一些字符,并假设其中只有一个字符。你的“真实形象”符合这些条件吗?如果是,只需将其输入模型。如果没有,则需要更复杂的模型,或者使用该模型按大小与输入匹配的块“扫描”图像,直到找到字符或停止。这个想法仍然很粗糙,但也许是一个开始的想法。这真的取决于你想做什么。