Command line 如何从命令行使用tesseract在打开的窗口内进行读取?

Command line 如何从命令行使用tesseract在打开的窗口内进行读取?,command-line,ocr,Command Line,Ocr,我试图从命令行使用tesseract在打开的窗口的内容上运行OCR。我特别愿意阅读当前打开的记事本窗口中键入的文本 我在这里阅读了文档和wiki: 但是我在这个项目中没有找到任何对我有帮助的东西,而且我在这里也搜索了类似的问题(关于OCR有很多),但在我的案例中似乎没有什么是有效的 可行吗 我主要是一名PHP程序员(只是为了好玩而编写代码),没有使用非web语言的经验 提前感谢。Tesseract设计用于将TIFF图像作为输入,而不了解Windows或屏幕设备上下文。因此,您需要添加代码来定位记

我试图从命令行使用tesseract在打开的窗口的内容上运行OCR。我特别愿意阅读当前打开的记事本窗口中键入的文本

我在这里阅读了文档和wiki:

但是我在这个项目中没有找到任何对我有帮助的东西,而且我在这里也搜索了类似的问题(关于OCR有很多),但在我的案例中似乎没有什么是有效的

可行吗

我主要是一名PHP程序员(只是为了好玩而编写代码),没有使用非web语言的经验


提前感谢。

Tesseract设计用于将TIFF图像作为输入,而不了解Windows或屏幕设备上下文。因此,您需要添加代码来定位记事本窗口的窗口句柄,执行屏幕捕获并根据windows报告的当前窗口大小剪裁窗口,并将生成的图像保存到文件中。这个图像很可能是黑白的,这将使OCR更容易,因为我怀疑Tesseract 2.0只适用于黑白图像。下一个问题是,由于源图像的DPI(分辨率)较低,因此Tesseract gving结果较差

为了评估您的方法的适用性,我将通过打开记事本、截图、在MSPaint中打开截图、剪切要进行OCR的文本、将剪切的图像保存到TIFF或BMP并将此文件发送到Tesseract来执行一些手动测试。如果结果没有你所需要或期望的那么好,这可以节省你大量的时间和精力