如何获取PDF文件元数据';页面大小';使用Python?

如何获取PDF文件元数据';页面大小';使用Python?,python,scanning,pypdf2,page-size,Python,Scanning,Pypdf2,Page Size,我尝试在Python3中使用PyPDF2模块,但无法显示“页面大小”属性。 我想知道在扫描到PDF文件之前,纸张的尺寸是多少 大概是这样的: import PyPDF2 pdf=PdfFileReader("sample.pdf","rb") print(pdf.getNumPages()) 但是我正在寻找另一个Python函数,而不是例如getNumPages() 下面的此命令打印某种元数据,但不显示页面大小: pdf_info=pdf.getDocumentInfo() print(pdf

我尝试在Python3中使用PyPDF2模块,但无法显示“页面大小”属性。 我想知道在扫描到PDF文件之前,纸张的尺寸是多少

大概是这样的:

import PyPDF2
pdf=PdfFileReader("sample.pdf","rb")
print(pdf.getNumPages())
但是我正在寻找另一个Python函数,而不是例如getNumPages()

下面的此命令打印某种元数据,但不显示页面大小:

pdf_info=pdf.getDocumentInfo()
print(pdf_info)

此代码应该可以帮助您:

import PyPDF2
pdf = PyPDF2.PdfFileReader("a.pdf","rb")
p = pdf.getPage(1)

w_in_user_space_units = p.mediaBox.getWidth()
h_in_user_space_units = p.mediaBox.getHeight()

# 1 user space unit is 1/72 inch
# 1/72 inch ~ 0.352 millimeters

w = float(p.mediaBox.getWidth()) * 0.352
h = float(p.mediaBox.getHeight()) * 0.352

~0.352
正是
25.4/72