Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/jpa/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将基于文本的pdf转换为基于图像的pdf_Pdf_File Conversion - Fatal编程技术网

将基于文本的pdf转换为基于图像的pdf

将基于文本的pdf转换为基于图像的pdf,pdf,file-conversion,Pdf,File Conversion,有时,由于某些公司的默认流程,格式良好(TeX'ed)的pdf会转换为Microsoft Word。这会严重破坏pdf的布局(和字体?),可能导致无法使用。这个问题的一个可能的解决方案是将pdf从基于文本转换为基于图像,以阻止向Word的错误转换 这个问题是关于如何将基于文本的pdf转换为基于图像的pdf。您的问题非常广泛,但您确实指出了pdf和任何结构化文档格式之间的基本不兼容。如果您正在寻找问题的编程答案,通常的方法是创建图像绘制上下文而不是PDF上下文,并将页面的所有元素呈现到该上下文中。

有时,由于某些公司的默认流程,格式良好(TeX'ed)的pdf会转换为Microsoft Word。这会严重破坏pdf的布局(和字体?),可能导致无法使用。这个问题的一个可能的解决方案是将pdf从基于文本转换为基于图像,以阻止向Word的错误转换


这个问题是关于如何将基于文本的pdf转换为基于图像的pdf。

您的问题非常广泛,但您确实指出了pdf和任何结构化文档格式之间的基本不兼容。如果您正在寻找问题的编程答案,通常的方法是创建图像绘制上下文而不是PDF上下文,并将页面的所有元素呈现到该上下文中。结果是一个图像,然后将其绘制到PDF上下文中。

现在我确实有了一个似乎可行的答案,但我想知道其他选择。我的解决方案还有一个缺点,即内部或外部链接被破坏。从理论上讲,保持链接完整是可能的。最后,我的解决方案适用于单页文档,但可能不适用于其他文档

pdftoppm -r 300 text.pdf | convert -page A4 - text.pdf.ppm.pdf
这将转换为基于像素的格式并显著增加文件大小(对于我的测试用例是10倍)