在python中将基于图像的pdf转换为图像文件（png/jpg）_Python_Python 3.x_Pdf_Image Processing

在python中将基于图像的pdf转换为图像文件（png/jpg）

python python-3.x pdf image-processing

在python中将基于图像的pdf转换为图像文件（png/jpg）,python,python-3.x,pdf,image-processing,Python,Python 3.x,Pdf,Image Processing,我想用Python将基于图像的PDF转换为图像（.png/.jpg）文件，这样我就可以进一步使用该图像从中提取表格数据。我不想从命令行运行代码我目前正在使用Python 3.7.1版本和Pycharm IDE 我尝试了stackoverflow上提供的代码，但没有任何效果，它运行了，但无法从基于图像的PDF文件中提取图像。下面是它的链接。另外，尝试了来自dzone.com的代码，下面是链接，但没有任何效果以下是基于图像的PDF文件链接：链接1：链接2：请对此提出任何解决方

我想用Python将基于图像的PDF转换为图像（.png/.jpg）文件，这样我就可以进一步使用该图像从中提取表格数据。我不想从命令行运行代码

我目前正在使用Python 3.7.1版本和Pycharm IDE

我尝试了stackoverflow上提供的代码，但没有任何效果，它运行了，但无法从基于图像的PDF文件中提取图像。下面是它的链接。

另外，尝试了来自dzone.com的代码，下面是链接，但没有任何效果

以下是基于图像的PDF文件链接：

链接1：

链接2：

请对此提出任何解决方案。

pdf2image库将pdf转换为图像。当查看PDF时，它们只是图像，而不是其他内容，您可以将页面转换为图像

安装

pip安装pdf2image

安装后，您可以使用以下代码获取图像

from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)

# Saving pages in jpeg format

for page in pages:
    page.save('out.jpg', 'JPEG')

pdf2image

库将pdf转换为图像。当查看PDF时，它们只是图像，而不是其他内容，您可以将页面转换为图像

安装

pip安装pdf2image

安装后，您可以使用以下代码获取图像

from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)

# Saving pages in jpeg format

for page in pages:
    page.save('out.jpg', 'JPEG')

您好，kuldeep，我在运行代码时出现上述错误，我也安装了pdf2image python模块，但仍然出现此错误您需要

poppler

，请检查此处：谢谢您，kuldeep，您的代码在安装popplerhello kuldeep后工作正常，我在运行代码时出现上述错误，我还安装了pdf2image python模块，但仍然出现此错误您需要

poppler

，请检查此处：谢谢kuldeep，您的代码在安装poppler后工作正常这是否回答了您的问题？谢谢你，joe，这个链接对我很有帮助，这是我一直在搜索的内容。如果这是你问题的解决方案，请关闭/删除它。这是否回答了你的问题？谢谢你，joe，这个链接对我很有帮助，这是我一直在搜索的内容。如果它能解决你的问题，请关闭/删除它。