Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/asp.net/33.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
phpOCR的极限_Php_Ocr - Fatal编程技术网

phpOCR的极限

phpOCR的极限,php,ocr,Php,Ocr,我下载了phpOCR,发现如果图像文件有一个单词,它可以完全使用,但是如果图像有两个或更多单词,并且使用不同的字体,它就没有那么大的用处了 我想知道是否有人使用过PHP OCR,他们发现了它的局限性。是的,我曾经使用过phpOCR。非常好,但是你需要一个最小尺寸的图像才能有效(我不记得了,但例如1厘米高的字符)。如果您需要它来解析CAPTCHA,请忘记它 为什么不试试Tesseract?解析输出(纯文本)很容易,因为我不知道如何在PHP中使用它。tesseract image.tif生成imag

我下载了phpOCR,发现如果图像文件有一个单词,它可以完全使用,但是如果图像有两个或更多单词,并且使用不同的字体,它就没有那么大的用处了


我想知道是否有人使用过PHP OCR,他们发现了它的局限性。

是的,我曾经使用过phpOCR。非常好,但是你需要一个最小尺寸的图像才能有效(我不记得了,但例如1厘米高的字符)。如果您需要它来解析CAPTCHA,请忘记它

为什么不试试Tesseract?解析输出(纯文本)很容易,因为我不知道如何在PHP中使用它。
tesseract image.tif
生成
image.txt
,其中填充了OCR文本。这是很简单的。@Blender是的,我知道,但是一个PHP示例会很好,而且问题是它需要能够在web服务器(CentOS 5)上运行,而windows XPTesseract不应该在发行版的软件包存储库中可用。例如,googlephp运行命令。您需要执行上述命令并读取
txt
文件。它很简单。不,我不想用它,我想用它,这样我可以扫描账单,找到单词,从itI中得到我需要的东西。我很抱歉这样的例子:(我记得最后以某种方式使用了linux OCR实用程序来输入php脚本。允许获得最佳结果。祝你好运!你还记得你使用的是哪种linux OCR吗?(字符应至少有20像素高)当时我尝试:
现在我尝试将gif图像转换为基于矢量的图像,然后放大,然后减少边缘(以分离字母)然后通过OCR程序传递。所有这些都应该在您的服务器上自动运行。这至少应该是一个VPS。
这是我的客户两年前关于刮片作业的一个解释。不幸的是,我可以添加更多内容,因为源代码突然被转换为html是不必要的。请执行所有这些过程。但正如您所看到的,这是可能的乐。