使用开源工具扫描PDF中的反别名文本

使用开源工具扫描PDF中的反别名文本,pdf,imagemagick,Pdf,Imagemagick,我经常在MacOS上使用300 dpi的普通扫描工具和“文本”设置,将字母或其他文本扫描到PDF。 这些文件很小,通常可读性很好,但文本非常像素化。是否有任何开源工具(如imagemagick、ghostscript等)可以提高/消除文本质量? 还是我走错了路?是否最好以灰度扫描文件,然后使用一些工具 编辑:因为我没有得到答案,我添加了更多的细节,因为在过去的几天里,我玩了一些imagemagick来实现我的目标 因此,也许我可以指定我的问题:如何对扫描页面的文本进行抗锯齿?抗锯齿是一种光学技巧

我经常在MacOS上使用300 dpi的普通扫描工具和“文本”设置,将字母或其他文本扫描到PDF。 这些文件很小,通常可读性很好,但文本非常像素化。是否有任何开源工具(如imagemagick、ghostscript等)可以提高/消除文本质量? 还是我走错了路?是否最好以灰度扫描文件,然后使用一些工具

编辑:因为我没有得到答案,我添加了更多的细节,因为在过去的几天里,我玩了一些imagemagick来实现我的目标


因此,也许我可以指定我的问题:如何对扫描页面的文本进行抗锯齿?

抗锯齿是一种光学技巧,可以提高纯视觉质量。然而,实现这一目标的通常方法是采取一个大样本,然后再对该样本进行下采样。当然,试图“增强”现有的低rez文本以获得更高的质量,这是你只在“CSI”中看到的吗?您最好使用OCR--“文本”始终具有最好的质量。文本以300dpi扫描,我希望保持此分辨率,因为建议共享文件,可能有人希望打印文件。在这种情况下使用OCR是什么意思?是否完全删除pdf中的图像并将其替换为文本?