用python从屏幕中提取文本

用python从屏幕中提取文本,python,screen,Python,Screen,是否有用于从png位图屏幕截图中提取文本的库等 它是用于自动调光器的,并且(例如)能够读取按钮等。我已经检查了Tesseract,但它似乎是用于图片,而不是计算机屏幕字体 如果您正在处理少量可能的匹配(即:您想要识别两个或三个不同的按钮),最简单的方法是在以前的屏幕截图中隔离这些按钮,将它们保存到单个文件中,然后使用某种形式的模板匹配,即 然而,如果您需要实际执行按钮文本的识别,则需要一个OCR引擎。如果可以的话,Tesseract是一个很好的候选人(这是一个漫长的过程)。正如您所提到的,如果您

是否有用于从png位图屏幕截图中提取文本的库等


它是用于自动调光器的,并且(例如)能够读取按钮等。我已经检查了Tesseract,但它似乎是用于图片,而不是计算机屏幕字体

如果您正在处理少量可能的匹配(即:您想要识别两个或三个不同的按钮),最简单的方法是在以前的屏幕截图中隔离这些按钮,将它们保存到单个文件中,然后使用某种形式的模板匹配,即


然而,如果您需要实际执行按钮文本的识别,则需要一个OCR引擎。如果可以的话,Tesseract是一个很好的候选人(这是一个漫长的过程)。正如您所提到的,如果您使用的是小字体,则需要执行此操作,而tesseract最初并没有接受过识别小字体的培训。如果不能,python中还有一些其他可用的引擎,比如它非常复杂,因为每个应用程序都会自己绘制屏幕。您需要的是屏幕捕获和文本检测。因为它是一个位图,所以不应该那么复杂,因为没有噪音?我只是想知道是否有人已经这样做了。据我所知,没有专门为识别屏幕截图中的屏幕字体而设计的OCR库。一些OCR库在这方面可能比其他库更好,但我认为这从来不是任何人的主要目标。(这并不像你想象的那么简单,OS X、Windows和大多数*nix程序上的文本引擎都使用矢量字体,允许自定义字体,消除它们的别名,在颜色和透明度等方面做一些奇特的事情,所以这不仅仅是“检测这96个固定位图”的问题。)不管怎样,你真的尝试过Tesseract吗,或者只是阅读概述?我试过Tesseract,但它没有捕捉到任何字符。根据常见问题,它过滤掉小于10像素的物体。也许我可以对它进行一些调整。你也可以连接到目标应用程序,尽管如果不是你的应用程序,这需要一些反向工程。我也一直在尝试做同样的事情,自从培训Tesseract让我非常失望(说来话长)以来,我一直在尝试