如何使用best for ocr将pdf扫描图像转换为高分辨率tiff?

如何使用best for ocr将pdf扫描图像转换为高分辨率tiff?,pdf,imagemagick,tiff,Pdf,Imagemagick,Tiff,我使用image magick将pdf转换为tiff图像, 从500kb到4.6mb的文件大小 问题是tiff图像中的转换结果不好。有些文字很难读 这是我在cli中的简单命令 convert \ pph.pdf \ pph-psd.tiff PDF扫描图像: Tiff图像: 为什么会发生这种情况,以及如何使用best for ocr将pdf扫描图像转换为高分辨率tiff?之所以会发生这种情况,是因为ImageMagick是一个光栅图像处理器,它使用默认的72dpi网格对pdf进行了光栅化,

我使用image magick将pdf转换为tiff图像, 从500kb到4.6mb的文件大小

问题是tiff图像中的转换结果不好。有些文字很难读

这是我在cli中的简单命令

convert \
pph.pdf \
pph-psd.tiff
PDF扫描图像:

Tiff图像:


为什么会发生这种情况,以及如何使用best for ocr将pdf扫描图像转换为高分辨率tiff?

之所以会发生这种情况,是因为ImageMagick是一个光栅图像处理器,它使用默认的72dpi网格对pdf进行了光栅化,这对于您的需要来说太粗糙了。在光栅化之前,需要设置更高的密度:

convert -density 288 input.pdf -compress lzw result.tiff


您最好安装Poppler工具,并使用它的
pdfimages
工具提取图像。

如果您愿意,可以尝试为我工作的Coolutils TotalPDFConverter