在python中将基于图像的pdf转换为图像文件(png/jpg)
我想用Python将基于图像的PDF转换为图像(.png/.jpg)文件,这样我就可以进一步使用该图像从中提取表格数据。 我不想从命令行运行代码 我目前正在使用Python 3.7.1版本和Pycharm IDE 我尝试了stackoverflow上提供的代码,但没有任何效果,它运行了,但无法从基于图像的PDF文件中提取图像。 下面是它的链接。 另外,尝试了来自dzone.com的代码,下面是链接,但没有任何效果 以下是基于图像的PDF文件链接: 链接1: 链接2:在python中将基于图像的pdf转换为图像文件(png/jpg),python,python-3.x,pdf,image-processing,Python,Python 3.x,Pdf,Image Processing,我想用Python将基于图像的PDF转换为图像(.png/.jpg)文件,这样我就可以进一步使用该图像从中提取表格数据。 我不想从命令行运行代码 我目前正在使用Python 3.7.1版本和Pycharm IDE 我尝试了stackoverflow上提供的代码,但没有任何效果,它运行了,但无法从基于图像的PDF文件中提取图像。 下面是它的链接。 另外,尝试了来自dzone.com的代码,下面是链接,但没有任何效果 以下是基于图像的PDF文件链接: 链接1: 链接2: 请对此提出任何解决方
请对此提出任何解决方案。pdf2image库将pdf转换为图像。当查看PDF时,它们只是图像,而不是其他内容,您可以将页面转换为图像 安装
pip安装pdf2image
安装后,您可以使用以下代码获取图像
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
# Saving pages in jpeg format
for page in pages:
page.save('out.jpg', 'JPEG')
pdf2image
库将pdf转换为图像。当查看PDF时,它们只是图像,而不是其他内容,您可以将页面转换为图像
安装
pip安装pdf2image
安装后,您可以使用以下代码获取图像
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500)
# Saving pages in jpeg format
for page in pages:
page.save('out.jpg', 'JPEG')
您好,kuldeep,我在运行代码时出现上述错误,我也安装了pdf2image python模块,但仍然出现此错误您需要
poppler
,请检查此处:谢谢您,kuldeep,您的代码在安装popplerhello kuldeep后工作正常,我在运行代码时出现上述错误,我还安装了pdf2image python模块,但仍然出现此错误您需要poppler
,请检查此处:谢谢kuldeep,您的代码在安装poppler后工作正常这是否回答了您的问题?谢谢你,joe,这个链接对我很有帮助,这是我一直在搜索的内容。如果这是你问题的解决方案,请关闭/删除它。这是否回答了你的问题?谢谢你,joe,这个链接对我很有帮助,这是我一直在搜索的内容。如果它能解决你的问题,请关闭/删除它。