Image processing 将文本与背景分开的理想解决方案?

Image processing 将文本与背景分开的理想解决方案?,image-processing,computer-vision,imagefilter,Image Processing,Computer Vision,Imagefilter,假设我有文本页的灰度照片。每张纸都是完全白色的,文本是完全黑色的 不幸的是,光线不均匀,也会出现透视明暗处理,纸张也可能弯曲。当然,图像上有一些小的高频噪声 我确信,在这种情况下,应该有一个近乎理想的解决方案来分离文本和背景 那是什么呢?:) 我不相信这是不可能的,甚至很难把这样的灰度图像变成近乎完美的黑白照片。我无法证明这一点,但我根据自己的感知判断:我不需要任何智力就能用眼睛识别出这样的图片。它们可以是任何语言,甚至是不熟悉的语言,但我会看看到底写了什么 那么,如何教计算机做同样的事情呢 更

假设我有文本页的灰度照片。每张纸都是完全白色的,文本是完全黑色的

不幸的是,光线不均匀,也会出现透视明暗处理,纸张也可能弯曲。当然,图像上有一些小的高频噪声

我确信,在这种情况下,应该有一个近乎理想的解决方案来分离文本和背景

那是什么呢?:)

我不相信这是不可能的,甚至很难把这样的灰度图像变成近乎完美的黑白照片。我无法证明这一点,但我根据自己的感知判断:我不需要任何智力就能用眼睛识别出这样的图片。它们可以是任何语言,甚至是不熟悉的语言,但我会看看到底写了什么

那么,如何教计算机做同样的事情呢

更新

考虑原始图像

任何全局重分解都将导致伪影(1)和不均匀文本表示(2)


我需要一些thresolding,它查找本地统计信息。

切换到自适应阈值

在这里您可以找到一些介绍-


自适应阈值设计就是为了解决这类问题。

你可以去除噪声,噪声通常是松散的内容,你可以用包围的颜色使它们褪色,你需要将黑色完全设置为小于范围(127127)的颜色,并将其作为较高范围内的白色,只需这样做并查看输出,你能提供一张样品图片吗?见我的答案。我认为再溶解是处理的最后一部分。在再溶解之前,图像应该是可逆的。那么我真的不明白你想达到什么目的。任何只将图像更改为黑白的算法都是不可逆的。此外,如果您想要BW图像,为什么还要进行额外的预处理,而您可以在一个步骤中获得所需的结果?为了进一步改进结果,可以对生成的BW图像应用形态学操作。这些行动将进一步提高成果的质量。