Java Tess4j-Pdf至Tiff至tesseract-”文件;警告:分辨率0 dpi无效。用70代替。”;
我正在使用tess4j(net.sourceforge.tess4j:tess4j:4.4.0)并在pdf文件上尝试OCR。 因此,据我所知,我必须首先将pdf转换为tiff或png(任何建议的格式?),我是这样做的:Java Tess4j-Pdf至Tiff至tesseract-”文件;警告:分辨率0 dpi无效。用70代替。”;,java,ocr,tesseract,tess4j,Java,Ocr,Tesseract,Tess4j,我正在使用tess4j(net.sourceforge.tess4j:tess4j:4.4.0)并在pdf文件上尝试OCR。 因此,据我所知,我必须首先将pdf转换为tiff或png(任何建议的格式?),我是这样做的: tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile)); 并得到以下警告: Warning: Invalid resolution 0 dpi. Using 70 instead. 问题 这对我的扫描结果有影
tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile));
并得到以下警告:
Warning: Invalid resolution 0 dpi. Using 70 instead.
问题
- 这对我的扫描结果有影响吗?(如果没有,请确定-我可以删除警告)
- 有没有办法手动设置DPI,还是应该
帮我处理convertPdf
instance.SetTessVariable(“用户定义的dpi”,“300”)代码>
或
TessBaseApisetSourceSolution(TessBaseAPI句柄,int-ppi)代码>
您可以通过以下方式抑制控制台输出:
instance.setTessVariable(“debug_文件”,“dev/null”)代码>未设置默认分辨率
为了补充nguyenq的回答:
instance.setTessVariable("user_defined_dpi", "300");