Python图像检测PDF

Python图像检测PDF,python,pdf,image-processing,Python,Pdf,Image Processing,如何检测PDF文件(Python)中的图像 我必须检测图像是否存在于PDF文件中。 有没有办法呢 我尝试过PyPdf,但没有成功。请帮帮我 谢谢 感谢您的任何回复有PDFMiner。它也有一个。这可以帮助您搜索图像。通过使用: from pdfminer.layout import LAParams from pdfminer.converter import PDFPageAggregator # Set parameters for analysis. laparams = LAParam

如何检测PDF文件(Python)中的图像

我必须检测图像是否存在于PDF文件中。 有没有办法呢

我尝试过PyPdf,但没有成功。请帮帮我

谢谢
感谢您的任何回复

有PDFMiner。它也有一个。这可以帮助您搜索图像。通过使用:

from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator

# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
    interpreter.process_page(page)
    # receive the LTPage object for the page.
    layout = device.get_result()
layout
是一个
LTPage
-对象,它基本上是页面上所有布局对象的树。你可以沿着这棵树的所有分支走一走,检查某处是否有
LTImage
-对象,然后你就知道有图像了


PDFMiner仅适用于Python2.x。

有PDFMiner。它也有一个。这可以帮助您搜索图像。通过使用:

from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator

# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
    interpreter.process_page(page)
    # receive the LTPage object for the page.
    layout = device.get_result()
layout
是一个
LTPage
-对象,它基本上是页面上所有布局对象的树。你可以沿着这棵树的所有分支走一走,检查某处是否有
LTImage
-对象,然后你就知道有图像了


PDFMiner仅适用于Python 2.x。

非常感谢@Thorsten。。我会试试这个欢迎你,如果你成功了请告诉我。这里有一个关于pdfminer循环浏览这些不同LTImage/LTPage对象能力的很好的“摘要”:非常感谢@Thorsten。。这里有一个关于pdfminer在这些不同的LTImage/LTPage对象之间循环的能力的很好的“总结”:澄清一下,提问者的问题还不错:他想要一些示例代码来使用python提取PDF文件的图像内容(如果存在的话)。提供的答案确实准确地回答了这个问题。只是澄清一下,提问者的问题并不太糟糕:他需要一些示例代码来使用python提取PDF文件的图像内容(如果存在)。提供的答案确实准确地回答了这个问题。