Artificial intelligence 感知器可以用来检测手写数字吗？_Artificial Intelligence_Ocr_Neural Network_Pattern Recognition_Perceptron

Artificial intelligence 感知器可以用来检测手写数字吗？

artificial-intelligence neural-network

Artificial intelligence 感知器可以用来检测手写数字吗？,artificial-intelligence,ocr,neural-network,pattern-recognition,perceptron,Artificial Intelligence,Ocr,Neural Network,Pattern Recognition,Perceptron,假设我有一个小位图，其中包含手写的一个数字（0..9）是否可以使用（两层）感知机检测数字除了使用神经网络之外，还有其他可能从位图中检测单个数字吗？这里有一个指向手写数字庞大数据库的链接。头版也有许多不同方法的相关性能数据，包括两层神经网络。这应该给你一个好的开始：你可能还想看看他所说的哪些表现相当好，他的网站上有一个很好的解释性讲座（非常值得关注）。这是一个使用经过训练的神经网络来检测单个数字（图像大小固定为28*28）。将位图的每个像素直接输入神经网络需要大量训练，并且在处理图像的缩放

假设我有一个小位图，其中包含手写的一个数字（0..9）

是否可以使用（两层）感知机检测数字

除了使用神经网络之外，还有其他可能从位图中检测单个数字吗？

这里有一个指向手写数字庞大数据库的链接。头版也有许多不同方法的相关性能数据，包括两层神经网络。这应该给你一个好的开始：

你可能还想看看他所说的哪些表现相当好，他的网站上有一个很好的解释性讲座（非常值得关注）。

这是一个使用经过训练的神经网络来检测单个数字（图像大小固定为28*28）。

将位图的每个像素直接输入神经网络需要大量训练，并且在处理图像的缩放或旋转时效果不佳

为了帮助神经网络执行良好的分类，您需要执行一些预处理步骤

标准化图像：
- 调整对比度和亮度，使图像的直方图与参考图像匹配
- 模糊图像，以消除噪声
- 使用一些阈值将其转换为黑白
- 找到形状的边界框，缩放到预定义的大小
计算可用于区分一个数字和另一个数字的图像的各种特征：
- 图像的位置-告诉您形状中有多少“孔”（例如，数字8有两个孔）
- 白色像素数（数字区域）
- 白色像素坐标集的长度-告诉您形状有多“拉长”
- 。。。您可以想到的其他特性往往具有相似数字的相似值

主分量还可用于规范化形状的旋转，以使最长轴垂直

这些特征是输入到神经网络进行分类的，而不是像素。

我实际上已经尝试使用神经网络执行类似的任务，我发现（到目前为止）如果我将实际像素提供给网络，而不是执行计算并将这些计算交给网络，效果会更好。当然，我可能没有选择好的计算作为输入。但到目前为止，它工作得还不错，没有假设图像已经足够标准化。