Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/395.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java Tess4j-Pdf至Tiff至tesseract-”文件;警告:分辨率0 dpi无效。用70代替。”;_Java_Ocr_Tesseract_Tess4j - Fatal编程技术网

Java Tess4j-Pdf至Tiff至tesseract-”文件;警告:分辨率0 dpi无效。用70代替。”;

Java Tess4j-Pdf至Tiff至tesseract-”文件;警告:分辨率0 dpi无效。用70代替。”;,java,ocr,tesseract,tess4j,Java,Ocr,Tesseract,Tess4j,我正在使用tess4j(net.sourceforge.tess4j:tess4j:4.4.0)并在pdf文件上尝试OCR。 因此,据我所知,我必须首先将pdf转换为tiff或png(任何建议的格式?),我是这样做的: tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile)); 并得到以下警告: Warning: Invalid resolution 0 dpi. Using 70 instead. 问题 这对我的扫描结果有影

我正在使用tess4j(net.sourceforge.tess4j:tess4j:4.4.0)并在pdf文件上尝试OCR。 因此,据我所知,我必须首先将pdf转换为tiff或png(任何建议的格式?),我是这样做的:

tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile)); 
并得到以下警告:

Warning: Invalid resolution 0 dpi. Using 70 instead.
问题

  • 这对我的扫描结果有影响吗?(如果没有,请确定-我可以删除警告)
  • 有没有办法手动设置DPI,还是应该
    convertPdf
    帮我处理

如果图像元数据中没有分辨率信息,Tesseract会尝试自行估计分辨率,以便在结果中计算字体大小信息

您可以尝试使用以下API设置输入图像分辨率:

instance.SetTessVariable(“用户定义的dpi”,“300”)

TessBaseApisetSourceSolution(TessBaseAPI句柄,int-ppi)

您可以通过以下方式抑制控制台输出:


instance.setTessVariable(“debug_文件”,“dev/null”)

未设置默认分辨率

为了补充nguyenq的回答:

instance.setTessVariable("user_defined_dpi", "300");