将基于文本的pdf转换为基于图像的pdf
有时,由于某些公司的默认流程,格式良好(TeX'ed)的pdf会转换为Microsoft Word。这会严重破坏pdf的布局(和字体?),可能导致无法使用。这个问题的一个可能的解决方案是将pdf从基于文本转换为基于图像,以阻止向Word的错误转换将基于文本的pdf转换为基于图像的pdf,pdf,file-conversion,Pdf,File Conversion,有时,由于某些公司的默认流程,格式良好(TeX'ed)的pdf会转换为Microsoft Word。这会严重破坏pdf的布局(和字体?),可能导致无法使用。这个问题的一个可能的解决方案是将pdf从基于文本转换为基于图像,以阻止向Word的错误转换 这个问题是关于如何将基于文本的pdf转换为基于图像的pdf。您的问题非常广泛,但您确实指出了pdf和任何结构化文档格式之间的基本不兼容。如果您正在寻找问题的编程答案,通常的方法是创建图像绘制上下文而不是PDF上下文,并将页面的所有元素呈现到该上下文中。
这个问题是关于如何将基于文本的pdf转换为基于图像的pdf。您的问题非常广泛,但您确实指出了pdf和任何结构化文档格式之间的基本不兼容。如果您正在寻找问题的编程答案,通常的方法是创建图像绘制上下文而不是PDF上下文,并将页面的所有元素呈现到该上下文中。结果是一个图像,然后将其绘制到PDF上下文中。现在我确实有了一个似乎可行的答案,但我想知道其他选择。我的解决方案还有一个缺点,即内部或外部链接被破坏。从理论上讲,保持链接完整是可能的。最后,我的解决方案适用于单页文档,但可能不适用于其他文档
pdftoppm -r 300 text.pdf | convert -page A4 - text.pdf.ppm.pdf
这将转换为基于像素的格式并显著增加文件大小(对于我的测试用例是10倍)