如何使用Ghostscript或ImageMagick从PDF中提取图像?
我需要渲染或获取特定PDF文件中的所有图像。如何使用Ghostscript或ImageMagick实现这一点 如果不给自己编写一个Ghostscript设备,你当然不能在Ghostscript中完成这项工作。如何使用Ghostscript或ImageMagick从PDF中提取图像?,pdf,imagemagick,ghostscript,poppler,Pdf,Imagemagick,Ghostscript,Poppler,我需要渲染或获取特定PDF文件中的所有图像。如何使用Ghostscript或ImageMagick实现这一点 如果不给自己编写一个Ghostscript设备,你当然不能在Ghostscript中完成这项工作。 我怀疑你也不能用ImageMagick做这件事。 你看过PDFtk吗 如果您使用的是Windows,则会出现一个快速的Google: 在Linux上: 您不能使用Ghostscript,但可以使用名为pdfimages的Poppler或XPDF命令行工具来完成: pdfimages -j
我怀疑你也不能用ImageMagick做这件事。
你看过PDFtk吗 如果您使用的是Windows,则会出现一个快速的Google: 在Linux上:
您不能使用Ghostscript,但可以使用名为
pdfimages的Poppler或XPDF命令行工具来完成:
pdfimages -j some.pdf subdir/image-prefix
所有图像现在将位于名为image-prefix-0001.jpg
,image-prefix-0002.jpg的subdir/
中
-j
参数将使命令尝试直接提取JPEG。如果无法创建JPEG,它将创建PNM或PPM,您可以始终使用ImageMagick进行转换:
convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg
提取1页的示例:
gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf
我想使用GS或image magic的原因是,他们使用的是我可以通过java运行的脚本,你推荐使用命令行命令或脚本的PDF工具来实现这一点吗?pdftk可以提取附件,但似乎无法提取图像。我想做类似的事情,但我想完全删除PDF中的所有图像,也就是说,pdf应该只包含文本/字体,而不包含图像,可以这样做吗?请帮忙。@codin:评论不是用来讨论一个全新的话题的。请提出一个新问题,将其标记为[ghostscript]
+[pdf]
,我会尽力回答。请说明您的请求的目的。保存文件大小?是否删除图像中包含的信息?或者?对于第二步,似乎更合适:magick-mogrify-format jpg*.ppm
这不会提取原始图像。它根据页面的外观呈现图像。例如,如果在图像上覆盖了文本,则在渲染图像中也会得到该文本。