Neural network 更好的滑动窗口,特征提取

Neural network 更好的滑动窗口,特征提取,neural-network,conv-neural-network,image-recognition,digits,inference,Neural Network,Conv Neural Network,Image Recognition,Digits,Inference,我目前正在尝试在视频流上实现数字识别器。它能够扫描对象上的手写数字,这些数字表示库存编号。数字写在同质背景上,因此没有硬对比度变化,只有带有数字的区域除外 首先我实现了经典的滑动窗口方法,然后我意识到这是为了实时性而降低速度。然后,我尝试计算图像的空间C维(C=类)地图,遵循“Overfeat”的方法,如以下文章所述:链接: 现在我问自己,这是否是解决这个问题的正确方法,是否有一个解决方案,我裁剪所有对比度发生巨大变化的图像区域,因为很明显,这个区域中会包含书写的数字 提前感谢您的帮助和时间

我目前正在尝试在视频流上实现数字识别器。它能够扫描对象上的手写数字,这些数字表示库存编号。数字写在同质背景上,因此没有硬对比度变化,只有带有数字的区域除外

首先我实现了经典的滑动窗口方法,然后我意识到这是为了实时性而降低速度。然后,我尝试计算图像的空间C维(C=类)地图,遵循“Overfeat”的方法,如以下文章所述:链接:

现在我问自己,这是否是解决这个问题的正确方法,是否有一个解决方案,我裁剪所有对比度发生巨大变化的图像区域,因为很明显,这个区域中会包含书写的数字

提前感谢您的帮助和时间