Python 将PDF转换为不带打印功能的图像打印输出
我找到了一种将PDF文件转换为JPG的方法,实际上是从PDF文件中提取图像文件。我已经设法用Python 将PDF转换为不带打印功能的图像打印输出,python,image,pdf,extract,Python,Image,Pdf,Extract,我找到了一种将PDF文件转换为JPG的方法,实际上是从PDF文件中提取图像文件。我已经设法用PyMuPDFlib实现了这一点。 这是该库的文档: 我看到了这个代码: 该代码: 我写了一个代码,没有给我任何错误,这是代码: import fitz import cv2 import numpy as np doc = fitz.open("sample15.pdf") #print(doc) my_images = [] for i in range(len(doc
PyMuPDF
lib实现了这一点。
这是该库的文档:
我看到了这个代码:
该代码:
我写了一个代码,没有给我任何错误,这是代码:
import fitz
import cv2
import numpy as np
doc = fitz.open("sample15.pdf")
#print(doc)
my_images = []
for i in range(len(doc)):
for img in doc.getPageImageList(i):
xref = img[0]
img = doc.extractImage(xref)
img = img["image"]
nparr = np.frombuffer(img, np.uint8)
img_np = cv2.imdecode(nparr, cv2.IMREAD_COLOR)
my_images.append(img_np)
如您所见,我没有任何打印功能,但我的程序打印以下内容:
mupdf: expected object number #this is printed red
xref 9 image type jpeg
xref 12 image type jpeg
xref 15 image type jpeg
xref 18 image type jpeg
xref 21 image type jpeg
xref 24 image type jpeg
为什么要获取此打印输出,如何删除它?
我猜它来自lib,但我不知道如何阻止它,因为输出可能来自您正在使用的某个库。您可以查看他们的文档以确定是否有日志级别选项,或者作为最后的“修复”,使用(和
.redirect\u stderr
)上下文管理器隐藏输出。该输出可能来自您正在使用的某个库。您可以查看他们的文档以确定是否有日志级别选项,或者作为最后的“修复”,使用(和.redirect\u stderr
)上下文管理器隐藏输出。我已经稍微更新了这个问题,您能告诉我如何删除这些自动打印吗?我看了文档,但没有找到任何解决方案。你看了我回答的后半部分了吗?你有没有点击查看文档?它有一个直接的例子。我更新了一点问题,你能告诉我如何删除这些自动打印吗?我看了文档,但没有找到任何解决方案。你看了我回答的后半部分了吗?你有没有点击查看文档?它有一个直接的例子。