Image 关于在黑板图像上使用OCR的建议

Image 关于在黑板图像上使用OCR的建议,image,image-processing,ocr,computer-vision,image-recognition,Image,Image Processing,Ocr,Computer Vision,Image Recognition,我试图得到一个黑板的图像,可以通过OCR读取。当然,大多数OCR软件不喜欢脏图像。我应该尝试通过什么图像处理来清理图像?立即,我会说反转图像(反转颜色,以便书写是黑白相间的)并稍微增加对比度。您可以尝试修改亮度,使已擦除的粉笔模糊消失在背景中。立即,我会说反转图像(反转颜色,使文字为黑白),并稍微增加对比度。您可以尝试修改亮度,使已擦除的粉笔雾消失在背景中。在Photoshop中,“级别”对话框可能是最有用的图像调整。在代码中模仿这一点完全是另一个主题 级别的基础是调整亮度级别的最大、最小和中点

我试图得到一个黑板的图像,可以通过OCR读取。当然,大多数OCR软件不喜欢脏图像。我应该尝试通过什么图像处理来清理图像?

立即,我会说反转图像(反转颜色,以便书写是黑白相间的)并稍微增加对比度。您可以尝试修改亮度,使已擦除的粉笔模糊消失在背景中。

立即,我会说反转图像(反转颜色,使文字为黑白),并稍微增加对比度。您可以尝试修改亮度,使已擦除的粉笔雾消失在背景中。

在Photoshop中,“级别”对话框可能是最有用的图像调整。在代码中模仿这一点完全是另一个主题

级别的基础是调整亮度级别的最大、最小和中点。通常显示在直方图上,您可以调整点以获得所需的对比度,但也可以移动中点以使图像中的文本最清晰;对OCR应用至关重要。通过移动中点,可以通过使笔迹消失在图像的亮(或暗)区域来“消除”通常围绕笔迹的灰度模糊


此外,您还可以尝试在这样的调整后将图像转换为1位,强制所有内容为黑色或白色。有时这会加快OCR过程。但要小心,它也会丢弃细节。

在Photoshop中,“级别”对话框可能是最有用的图像调整。在代码中模仿这一点完全是另一个主题

级别的基础是调整亮度级别的最大、最小和中点。通常显示在直方图上,您可以调整点以获得所需的对比度,但也可以移动中点以使图像中的文本最清晰;对OCR应用至关重要。通过移动中点,可以通过使笔迹消失在图像的亮(或暗)区域来“消除”通常围绕笔迹的灰度模糊


此外,您还可以尝试在这样的调整后将图像转换为1位,强制所有内容为黑色或白色。有时这会加快OCR过程。但要小心,它也会丢弃细节。

您是否尝试过边缘检测技术,如Roberts Cross和Sobel算子,以滤除图像中的噪声?如果看不到图像的质量,就说不出效果有多好。

您是否尝试过边缘检测技术,如Roberts Cross和Sobel算子来过滤图像中的噪声?如果看不到图像的质量,就不能说这会有多有效。

有商业解决方案,但清理电路板图像似乎是一项艰巨的任务。将OCR添加到未解决的问题中,您将得到。。。一个未解决的问题。

有商业解决方案,但清理电路板映像似乎是一个难题。将OCR添加到未解决的问题中,您将得到。。。一个未解决的问题。

不确定您在选择OCR解决方案时受到多大限制,但ABBYY OCR引擎(以及基于它的web API)包括自动图像清理/纹理移除选项。

不确定您在选择OCR解决方案时受到多大限制,但ABBYY OCR引擎(以及基于它的web API)是包括自动图像清理/纹理删除选项。

您试用过OCR软件吗?很可能OCR软件非常适合阅读本质上已经是黑白图像的内容

但是,如果要求您这样做,您可以尝试:

  • 对图像设置阈值。
    • 基本上,将图像的灰度版本转换为黑白像素
  • 执行二进制膨胀以增长其余对象
  • 进行二元腐蚀
  • 这个想法是通过膨胀然后腐蚀,你可以去除任何粗糙/嘈杂的边缘,然后你可以将骨架化的图像传递给OCR

    可能有很多方法可以达到类似的结果。考虑到有整本书都致力于计算机视觉,这个答案很难公正地回答这些问题

    我仅有的文本是1997年的,但肯定有更多关于这个主题的文章

    • 图像处理和计算机视觉算法-J.R.Parker
    • 数字图像处理-冈萨雷斯/伍兹

    您试用过OCR软件吗?很可能OCR软件非常适合阅读本质上已经是黑白图像的内容

    但是,如果要求您这样做,您可以尝试:

  • 对图像设置阈值。
    • 基本上,将图像的灰度版本转换为黑白像素
  • 执行二进制膨胀以增长其余对象
  • 进行二元腐蚀
  • 这个想法是通过膨胀然后腐蚀,你可以去除任何粗糙/嘈杂的边缘,然后你可以将骨架化的图像传递给OCR

    可能有很多方法可以达到类似的结果。考虑到有整本书都致力于计算机视觉,这个答案很难公正地回答这些问题

    我仅有的文本是1997年的,但肯定有更多关于这个主题的文章

    • 图像处理和计算机视觉算法-J.R.Parker
    • 数字图像处理-冈萨雷斯/伍兹

    您是否正在编写一些代码来处理图像?示例图像是什么样子的?对比度不够吗?太吵了?到目前为止,没有足够的信息对您有所帮助。嗯,呃,我还没有真正开始。我只是想要一些关于如何真正开始的建议。到目前为止,我一直在尝试从图像处理中得到什么样的结果。我认为这些服务器正在使用“tesseract”。注意,我一直在使用这个:作为示例图像