Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/logging/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Imagemagick Alfresco Transformer-Ubuntu脚本多页PDF到OCR_Imagemagick_Ocr_Alfresco_Tesseract - Fatal编程技术网

Imagemagick Alfresco Transformer-Ubuntu脚本多页PDF到OCR

Imagemagick Alfresco Transformer-Ubuntu脚本多页PDF到OCR,imagemagick,ocr,alfresco,tesseract,Imagemagick,Ocr,Alfresco,Tesseract,我在处理调用脚本进行转换时遇到的问题。我在ubuntu中有一个脚本,它将多页pdf拆分为单页pdf文件,然后使用convert(来自imagemagick)将其转换为tif,然后使用tesseract ocr生成html,使用文本层将其转换回pdf,并将所有内容合并回具有文本层的单个pdf。 脚本在控制台中工作正常,但在Alfresco中,由于路径中的环境变量不同,因此使用不同的转换(/opt/Alfresco-3.4.d/common/bin/convert)而不是/usr/bin/conve

我在处理调用脚本进行转换时遇到的问题。我在ubuntu中有一个脚本,它将多页pdf拆分为单页pdf文件,然后使用convert(来自imagemagick)将其转换为tif,然后使用tesseract ocr生成html,使用文本层将其转换回pdf,并将所有内容合并回具有文本层的单个pdf。 脚本在控制台中工作正常,但在Alfresco中,由于路径中的环境变量不同,因此使用不同的转换(/opt/Alfresco-3.4.d/common/bin/convert)而不是/usr/bin/convert。结果是pdf 1.3,而不是tiff,因此tesseract什么也不做。servlet是tomcat,我试图将/usr/bin/convert复制到catalina home,并复制到alfresco公共目录,将convert重命名为conv并调用它,等等,但什么都没有发生

我如何告诉Alfresco使用正确的转换,而不是他的/opt/Alfresco-3.4.d/common/bin/convert


谢谢

您的img.root属性设置为什么,可能是/usr吗?我还尝试在alfresco-global.properties中更改下一个img.root=/usr img.dyn=/usr/lib img.exe=/usr/bin/convert,但不起作用……我将te convert更改为在gs中使用ghostscript,但如果您将img.root设置为/usr,teseract将不起作用,如果您的覆盖属性文件中没有任何其他与img相关的设置,并且打开转换的调试日志,您应该希望使用/usr/bin/convert,如果没有,调试应该可以帮助您确定使用了什么Hanks Gagravarr,我可以用文件:/etc/passwd和etc/environment,然后是source/etc/environment来修复它。。。。