PDF文件的内部结构

PDF文件的内部结构,pdf,Pdf,我正在研究PDF文件的结构。 如何从PDF文件中确定纸张大小、边距和字体大小等信息? 我知道F13是给Helvetica的,但是其他字体呢?我甚至无法从AdobeDocAbout PDF中找到它们 我正在研究PDF文件的结构 请使用PDF规范执行此操作 如何确定纸张大小等信息 每个页面都有自己的大小,在页面字典中定义或继承: MediaBox矩形(必需;可继承)矩形(见7.9.5“矩形”), 以默认用户空间单位表示,应定义 页面所在的物理介质的边界 显示或打印(见14.11.2,“页面边界”)

我正在研究PDF文件的结构。 如何从PDF文件中确定纸张大小、边距和字体大小等信息? 我知道F13是给Helvetica的,但是其他字体呢?我甚至无法从AdobeDocAbout PDF中找到它们

我正在研究PDF文件的结构

请使用PDF规范执行此操作

如何确定纸张大小等信息

每个页面都有自己的大小,在页面字典中定义或继承:

MediaBox矩形(必需;可继承)矩形(见7.9.5“矩形”), 以默认用户空间单位表示,应定义 页面所在的物理介质的边界 显示或打印(见14.11.2,“页面边界”)

CropBox矩形(可选;可继承)以默认用户空间表示的矩形 单位,应定义默认用户空间的可见区域。 当显示或打印页面时,应剪裁页面内容 (裁剪)到该矩形,然后应用于输出 以某种实施方式定义的介质(见14.11.2, “页面边界”)。默认值:MediaBox的值。

(表30–页面对象中的条目)

边际

没有保证金,除非您指的是上面某些方框暗示的保证金

PDF文件的字体大小

用于绘制某些文本的字体大小由Tf指令在内容流中定义,并由当前转换矩阵和文本矩阵进行转换

font sizeTf将文本字体Tf设置为font,将文本字体大小Tfs设置为size。字体应为 当前文档的font子词典中字体资源的名称 资源字典;尺寸应为代表比例系数的数字。 字体或大小都没有初始值;应详细说明 在显示任何文本之前,显式地使用Tf

(表105–文本状态运算符)

此外,

我知道F13是给Helvetica的

可能有一个PDF页面是这样的,但下一个页面可能是F2HelvASDFjklgfklöjsflaksfd,或者任何您想要的页面

我正在研究PDF文件的结构

请使用PDF规范执行此操作

如何确定纸张大小等信息

每个页面都有自己的大小,在页面字典中定义或继承:

MediaBox矩形(必需;可继承)矩形(见7.9.5“矩形”), 以默认用户空间单位表示,应定义 页面所在的物理介质的边界 显示或打印(见14.11.2,“页面边界”)

CropBox矩形(可选;可继承)以默认用户空间表示的矩形 单位,应定义默认用户空间的可见区域。 当显示或打印页面时,应剪裁页面内容 (裁剪)到该矩形,然后应用于输出 以某种实施方式定义的介质(见14.11.2, “页面边界”)。默认值:MediaBox的值。

(表30–页面对象中的条目)

边际

没有保证金,除非您指的是上面某些方框暗示的保证金

PDF文件的字体大小

用于绘制某些文本的字体大小由Tf指令在内容流中定义,并由当前转换矩阵和文本矩阵进行转换

font sizeTf将文本字体Tf设置为font,将文本字体大小Tfs设置为size。字体应为 当前文档的font子词典中字体资源的名称 资源字典;尺寸应为代表比例系数的数字。 字体或大小都没有初始值;应详细说明 在显示任何文本之前,显式地使用Tf

(表105–文本状态运算符)

此外,

我知道F13是给Helvetica的


可能有一个PDF页面是这样的,但下一个页面可能是F2,HelvASDFjklgfklöjsflaksfd,或者任何你想要的字体大小,我如何获得Tf指令?pdf文件只能显示乱码文本:(这在规范中都有解释。如果你不想实现,只是为了分析,有很多PDF结构的浏览器,可以解压缩这些流供你检查,例如,或者。我可以找到字体信息(字体大小)吗在pdf中作为文本文件?我不知道是否有专门用于此任务的工具。请自行将其设置为stackoverflow问题。对于字体大小,如何获取Tf指令?pdf文件只能显示乱码文本:(这在规范中都有解释。如果你不想实现,只是为了分析,有很多PDF结构的浏览器,可以解压缩这些流供你检查,例如,或者。我可以找到字体信息(字体大小)吗在pdf文件中作为文本文件?我不知道是否有专门用于此任务的工具。请自行将其设置为stackoverflow问题。