使用开源工具扫描PDF中的反别名文本_Pdf_Imagemagick

使用开源工具扫描PDF中的反别名文本

pdf imagemagick

使用开源工具扫描PDF中的反别名文本,pdf,imagemagick,Pdf,Imagemagick,我经常在MacOS上使用300 dpi的普通扫描工具和“文本”设置，将字母或其他文本扫描到PDF。这些文件很小，通常可读性很好，但文本非常像素化。是否有任何开源工具（如imagemagick、ghostscript等）可以提高/消除文本质量？还是我走错了路？是否最好以灰度扫描文件，然后使用一些工具编辑：因为我没有得到答案，我添加了更多的细节，因为在过去的几天里，我玩了一些imagemagick来实现我的目标因此，也许我可以指定我的问题：如何对扫描页面的文本进行抗锯齿？抗锯齿是一种光学技巧

我经常在MacOS上使用300 dpi的普通扫描工具和“文本”设置，将字母或其他文本扫描到PDF。这些文件很小，通常可读性很好，但文本非常像素化。是否有任何开源工具（如imagemagick、ghostscript等）可以提高/消除文本质量？还是我走错了路？是否最好以灰度扫描文件，然后使用一些工具

编辑：因为我没有得到答案，我添加了更多的细节，因为在过去的几天里，我玩了一些imagemagick来实现我的目标

因此，也许我可以指定我的问题：如何对扫描页面的文本进行抗锯齿？

抗锯齿是一种光学技巧，可以提高纯视觉质量。然而，实现这一目标的通常方法是采取一个大样本，然后再对该样本进行下采样。当然，试图“增强”现有的低rez文本以获得更高的质量，这是你只在“CSI”中看到的吗？您最好使用OCR--“文本”始终具有最好的质量。文本以300dpi扫描，我希望保持此分辨率，因为建议共享文件，可能有人希望打印文件。在这种情况下使用OCR是什么意思？是否完全删除pdf中的图像并将其替换为文本？