Python 2.7 区分手写文本和机器打印文本
是否有任何有效的方法可以从包含手写文本和机器打印文本的噪声图像中检测并仅提取手写部分?图片附在下面。Python 2.7 区分手写文本和机器打印文本,python-2.7,matlab,opencv,image-processing,artificial-intelligence,Python 2.7,Matlab,Opencv,Image Processing,Artificial Intelligence,是否有任何有效的方法可以从包含手写文本和机器打印文本的噪声图像中检测并仅提取手写部分?图片附在下面。 您可以将此视为一个检测问题:检测(在周围绘制轴对齐的边界框)所有机器打印的字符 最简单的方法是滑动窗口+分类器: 从要知道“这是机器打印的文本吗”的图像中裁剪一个补丁 应用一个分类器,该分类器获取补丁作为输入,并输出“是的,它是打印文本”的概率 分类器很可能是CNN。我猜您的图像与给定图像具有相同的格式结构,具有固定格式的内容和机器打印文本的已知坐标,您可以使用坐标信息检索文本类别 正如@Ret
您可以将此视为一个检测问题:检测(在周围绘制轴对齐的边界框)所有机器打印的字符 最简单的方法是滑动窗口+分类器:
分类器很可能是CNN。我猜您的图像与给定图像具有相同的格式结构,具有固定格式的内容和机器打印文本的已知坐标,您可以使用坐标信息检索文本类别
正如@Rethunk所提到的,您还可以利用机器打印文本的字体信息来获得更精确的结果。我要求区分手写和机器打印文本的可能重复。提到的那个问题有些不同@s-m-shahinul-Islam机器打印文本的可能字体是什么?或者它可能是任何东西?就像任何关于图像处理的问题一样,您必须提供嵌入的或作为链接的示例图像。正如您当前提出的问题,您没有将所有包含手写和机器打印文本的图像限制在您可能感兴趣的子集内。把这个问题的表述看作是一项工程任务本身——你越精确,解决这个问题的机会就越大。像其他工程产品一样,图像处理系统的成败很大程度上取决于初始工程评估的质量。您是否找到了解决方案?我有一个非常相似的要求。正如你可以看到我上传的图片,这包含几个混合的手写和机器打印文本在一个水平线,因此它是很难裁剪@马丁·托迈不是说你应该一次收成。我是说,制作几乎所有的作物,让分类器完成工作。@cpanda:一旦你仔细研究了分类器,请接受@MartinThoma的回答。答案足以为你指明一个值得探索的方向。