Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Image processing 提高扫描文档的OCR准确性_Image Processing_Ocr_Image Scanner_Text Recognition - Fatal编程技术网

Image processing 提高扫描文档的OCR准确性

Image processing 提高扫描文档的OCR准确性,image-processing,ocr,image-scanner,text-recognition,Image Processing,Ocr,Image Scanner,Text Recognition,我正在使用标准Brother A3多功能扫描大量A3文档,然后使用FineReader Pro对图像进行OCR 然而,我在识别的字符中发现了很多错误,还有很多非字母数字的奇怪字符 有人能给我一些建议,以编程方式提高OCR的准确性,无论是扫描图像的预处理,还是识别文本的后处理 编辑:。它包括一些样本图像,我从中得到的结果最差。您是否有一个样本图像可以发布到某个地方,然后我们可以快速告诉您是什么导致了您的大多数问题。FineReader是最好的OCR引擎之一,所以肯定有一些原因可以解释为什么你会得

我正在使用标准Brother A3多功能扫描大量A3文档,然后使用FineReader Pro对图像进行OCR

然而,我在识别的字符中发现了很多错误,还有很多非字母数字的奇怪字符

有人能给我一些建议,以编程方式提高OCR的准确性,无论是扫描图像的预处理,还是识别文本的后处理



编辑:。它包括一些样本图像,我从中得到的结果最差。

您是否有一个样本图像可以发布到某个地方,然后我们可以快速告诉您是什么导致了您的大多数问题。FineReader是最好的OCR引擎之一,所以肯定有一些原因可以解释为什么你会得到很差的结果

这可能与较差的对比度和阈值设置、图像倾斜、扫描仪中的脏辊、复杂的彩色背景、抖动的背景、字体太小、扫描dpi太低等有关

在看到附加的图像后,出现了一些小问题

  • 背景页上有很多污点。FineReader似乎在您的图像上做了一项合理的工作
  • 有一些轻微的歪斜,但这并没有造成问题
  • FineReader与用于列标题的粗体高Arial字体混淆。
    4一个大问题似乎是页面底部区域对比度差,图像模糊。这似乎是扫描仪的问题,但可能是由于打印问题
  • 印刷很差,我猜这是报纸的扫描。大多数错误都是由于扫描问题造成的,因此很难通过编程改进结果

    首先,我会尝试用稍微高一点的分辨率扫描灰度图像,看看这是否有帮助。FineReader可以很好地处理灰度图像。如果需要黑白图像,请查看扫描仪驱动程序是否包含动态阈值设置,然后将其打开

    对于任何OCR引擎来说,您的图像都不是一件容易的任务。如果你能改进扫描,你会得到更好的结果。第3页右下角有很多噪音


    您使用的是什么版本的FineEasder?FR10可能会给出比以前版本更好的结果。

    这个问题与编程有什么关系?图像处理是数学/编程谢谢您的帮助!我将按照你的建议,比较结果。是的,我使用FR10。