Artificial intelligence 感知器可以用来检测手写数字吗?

Artificial intelligence 感知器可以用来检测手写数字吗?,artificial-intelligence,ocr,neural-network,pattern-recognition,perceptron,Artificial Intelligence,Ocr,Neural Network,Pattern Recognition,Perceptron,假设我有一个小位图,其中包含手写的一个数字(0..9) 是否可以使用(两层)感知机检测数字 除了使用神经网络之外,还有其他可能从位图中检测单个数字吗?这里有一个指向手写数字庞大数据库的链接。头版也有许多不同方法的相关性能数据,包括两层神经网络。这应该给你一个好的开始: 你可能还想看看他所说的哪些表现相当好,他的网站上有一个很好的解释性讲座(非常值得关注)。这是一个使用经过训练的神经网络来检测单个数字(图像大小固定为28*28)。将位图的每个像素直接输入神经网络需要大量训练,并且在处理图像的缩放

假设我有一个小位图,其中包含手写的一个数字(0..9)

是否可以使用(两层)感知机检测数字


除了使用神经网络之外,还有其他可能从位图中检测单个数字吗?

这里有一个指向手写数字庞大数据库的链接。头版也有许多不同方法的相关性能数据,包括两层神经网络。这应该给你一个好的开始:


你可能还想看看他所说的哪些表现相当好,他的网站上有一个很好的解释性讲座(非常值得关注)。

这是一个使用经过训练的神经网络来检测单个数字(图像大小固定为28*28)。

将位图的每个像素直接输入神经网络需要大量训练,并且在处理图像的缩放或旋转时效果不佳

为了帮助神经网络执行良好的分类,您需要执行一些预处理步骤

  • 标准化图像:
    • 调整对比度和亮度,使图像的直方图与参考图像匹配
    • 模糊图像,以消除噪声
    • 使用一些阈值将其转换为黑白
    • 找到形状的边界框,缩放到预定义的大小
  • 计算可用于区分一个数字和另一个数字的图像的各种特征:
    • 图像的位置-告诉您形状中有多少“孔”(例如,数字8有两个孔)
    • 白色像素数(数字区域)
    • 白色像素坐标集的长度-告诉您形状有多“拉长”
    • 。。。您可以想到的其他特性往往具有相似数字的相似值
主分量还可用于规范化形状的旋转,以使最长轴垂直


这些特征是输入到神经网络进行分类的,而不是像素。

我实际上已经尝试使用神经网络执行类似的任务,我发现(到目前为止)如果我将实际像素提供给网络,而不是执行计算并将这些计算交给网络,效果会更好。当然,我可能没有选择好的计算作为输入。但到目前为止,它工作得还不错,没有假设图像已经足够标准化。