如何使用Ghostscript或ImageMagick从PDF中提取图像?

如何使用Ghostscript或ImageMagick从PDF中提取图像?,pdf,imagemagick,ghostscript,poppler,Pdf,Imagemagick,Ghostscript,Poppler,我需要渲染或获取特定PDF文件中的所有图像。如何使用Ghostscript或ImageMagick实现这一点 如果不给自己编写一个Ghostscript设备,你当然不能在Ghostscript中完成这项工作。 我怀疑你也不能用ImageMagick做这件事。 你看过PDFtk吗 如果您使用的是Windows,则会出现一个快速的Google: 在Linux上: 您不能使用Ghostscript,但可以使用名为pdfimages的Poppler或XPDF命令行工具来完成: pdfimages -j

我需要渲染或获取特定PDF文件中的所有图像。如何使用Ghostscript或ImageMagick实现这一点

如果不给自己编写一个Ghostscript设备,你当然不能在Ghostscript中完成这项工作。
我怀疑你也不能用ImageMagick做这件事。
你看过PDFtk吗

如果您使用的是Windows,则会出现一个快速的Google:

在Linux上:


您不能使用Ghostscript,但可以使用名为
pdfimages的Poppler或XPDF命令行工具来完成:

pdfimages -j some.pdf subdir/image-prefix
所有图像现在将位于名为
image-prefix-0001.jpg
image-prefix-0002.jpg的
subdir/

-j
参数将使命令尝试直接提取JPEG。如果无法创建JPEG,它将创建PNM或PPM,您可以始终使用ImageMagick进行转换:

convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg

提取1页的示例:

gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf

我想使用GS或image magic的原因是,他们使用的是我可以通过java运行的脚本,你推荐使用命令行命令或脚本的PDF工具来实现这一点吗?pdftk可以提取附件,但似乎无法提取图像。我想做类似的事情,但我想完全删除PDF中的所有图像,也就是说,pdf应该只包含文本/字体,而不包含图像,可以这样做吗?请帮忙。@codin:评论不是用来讨论一个全新的话题的。请提出一个新问题,将其标记为
[ghostscript]
+
[pdf]
,我会尽力回答。请说明您的请求的目的。保存文件大小?是否删除图像中包含的信息?或者?对于第二步,似乎更合适:
magick-mogrify-format jpg*.ppm
这不会提取原始图像。它根据页面的外观呈现图像。例如,如果在图像上覆盖了文本,则在渲染图像中也会得到该文本。