Neural network 除了图像的下采样二值网格外,我可以使用哪些功能进行手写OCR?

Neural network 除了图像的下采样二值网格外,我可以使用哪些功能进行手写OCR?,neural-network,ocr,handwriting,feature-extraction,Neural Network,Ocr,Handwriting,Feature Extraction,您好,我一直在搜索关于哪些特征适合我在手写OCR分类神经网络中使用的研究论文。我是一个初学者,所以我刚刚拍摄了手写字符的图像,在其周围制作了一个边界框,然后将其调整为15x20的二进制图像。这意味着我有一个300个特征的输入层。从我在谷歌上找到的论文(大部分都是很老的)来看,这些方法确实各不相同。我的精度并不差,只是一个二进制网格的图像,但我想知道是否有其他功能,我可以用来提高我的精度。甚至只是给我指出正确的方向。我会非常感激的 谢谢, 扎克关于这个话题,我还没有读过任何实际的论文,但我的建议是

您好,我一直在搜索关于哪些特征适合我在手写OCR分类神经网络中使用的研究论文。我是一个初学者,所以我刚刚拍摄了手写字符的图像,在其周围制作了一个边界框,然后将其调整为15x20的二进制图像。这意味着我有一个300个特征的输入层。从我在谷歌上找到的论文(大部分都是很老的)来看,这些方法确实各不相同。我的精度并不差,只是一个二进制网格的图像,但我想知道是否有其他功能,我可以用来提高我的精度。甚至只是给我指出正确的方向。我会非常感激的

谢谢,
扎克

关于这个话题,我还没有读过任何实际的论文,但我的建议是要有创意。使用你能想到的任何有助于分类器识别数字的东西

我的第一个想法是尝试识别图像中的“线”,可能通过修改的“滑动窗口”算法(滑动/旋转线?),或者尝试识别图像中的“最佳拟合线”(帮助分类器响应斜体或书写风格的变化)。真的,如果你使用的是神经网络,它应该在没有你手动帮助的情况下学习这些东西(这就是它们的全部意义!)

我将首先关注您网络的结构和拓扑结构,以尝试提高性能,并且仅当您无法通过其他方式获得令人满意的性能时,才担心其他特性。你也可以尝试改进你已经拥有的特征,确保字符在图像中居中,或者尝试一种算法来倾斜斜体字符使其垂直


根据我的经验,这类事情通常不会有帮助,但你可能会幸运地遇到一个可以改善你的网络的事情:)

我没有读过任何关于这个话题的实际论文,但我的建议是要有创意。使用你能想到的任何有助于分类器识别数字的东西

我的第一个想法是尝试识别图像中的“线”,可能通过修改的“滑动窗口”算法(滑动/旋转线?),或者尝试识别图像中的“最佳拟合线”(帮助分类器响应斜体或书写风格的变化)。真的,如果你使用的是神经网络,它应该在没有你手动帮助的情况下学习这些东西(这就是它们的全部意义!)

我将首先关注您网络的结构和拓扑结构,以尝试提高性能,并且仅当您无法通过其他方式获得令人满意的性能时,才担心其他特性。你也可以尝试改进你已经拥有的特征,确保字符在图像中居中,或者尝试一种算法来倾斜斜体字符使其垂直

根据我的经验,这类事情通常没有帮助,但你可能会走运,遇到一个能改善你的网络的事情:)