PDF中图示符的精确边界框?
我试图计算矢量PDF中每个文本图示符的精确边界框 这包括跟踪CTM、绘制/定位PDF指令等,还包括计算“字形空间”中每个特定字形的边界(使用嵌入字体中GLYF表格中的信息) 我意识到PDF FontDescriptor为每个嵌入字体都包含一个粗略的边界框,但这是字体中所有字形的组合——即,适合字体中所有字形的最小边界框。出于我的目的,我需要更精确的定位 我的具体应用是从乐谱的矢量PDF中提取音乐语义。因此,一个很好的约束是,我可以假设glyph不是在同一个Tj/Tj操作符中绘制在一起的。每个图示符都是独立绘制的 另外,请注意,我将边界框定义为“可以包含图示符所有绘制部分的最小框”。没有必要忽略升序/降序等。在其他应用程序中,它们可能被视为边界框的“外部” 这里有很多活动部件,我发现调试起来很困难。下面是我想要帮助的:PDF中图示符的精确边界框?,pdf,fonts,glyph,Pdf,Fonts,Glyph,我试图计算矢量PDF中每个文本图示符的精确边界框 这包括跟踪CTM、绘制/定位PDF指令等,还包括计算“字形空间”中每个特定字形的边界(使用嵌入字体中GLYF表格中的信息) 我意识到PDF FontDescriptor为每个嵌入字体都包含一个粗略的边界框,但这是字体中所有字形的组合——即,适合字体中所有字形的最小边界框。出于我的目的,我需要更精确的定位 我的具体应用是从乐谱的矢量PDF中提取音乐语义。因此,一个很好的约束是,我可以假设glyph不是在同一个Tj/Tj操作符中绘制在一起的。每个图示
我认为获得真正准确信息的唯一方法是以给定的点大小实际渲染轮廓,并收集结果位图的范围 即使提取描述glyph的路径也无法提供完全准确的信息,因为暗示可能会微妙地(或者在某些情况下,不会如此微妙地)改变glyph的渲染方式。在任何情况下,提取路径的工作量与渲染位图的工作量一样大,可能更多 PDF中大致有三类字体:
/Identity
,这减少了问题的范围
<> p>对于额外的复杂性,您需要考虑代表字形的“边界框”的内容。你认为前进的宽度和左侧的轴承是包围盒的一部分,还是只是标记的区域? 请记住,PDF可以为字形指定与字体中定义的字形不同的宽度,并且两种字体都包含修改字体中定义的宽度的
/W
数组
如果你把左边的方位和前进的宽度当作字形的一部分,但是有一个<>代码>宽度>代码>数组,它的值比前进宽度要小,可能是两个字形看起来“碰撞”,但实际上它们之间仍然有空格。所有的
/Widths
都是减少前进宽度的空白,这样字形就比通常情况下更接近了
我使用MuPDF
对此进行了快速的抨击,给出了以下答案:
<span bbox="39.21884 163.68216 42.53509 163.99687" font="PlantinMTStd-Regular" size="11.935925">
<char bbox="39.21884 163.68216 42.53509 163.99687" x="39.21884" y="163.99687" c=" "/>
<span bbox="57.200607 163.69899 73.08967 165.2394" font="OpusStd" size="19.841537">
<char bbox="57.200607 163.69899 73.08967 165.2394" x="57.200607" y="165.2394" c="&"/>
<char bbox="82.003044 151.29828 90.63545 152.83868" x="82.003044" y="152.83868" c="˙"/>
<char bbox="144.7842 161.21884 153.1744 162.75925" x="144.7842" y="162.75925" c="œ"/>
<char bbox="181.67781 166.17912 190.06801 167.71953" x="181.67781" y="167.71953" c="œ"/>
<char bbox="226.16718 173.61955 236.8826 175.15996" x="226.16718" y="175.15996" c="w"/>
<char bbox="320.10638 153.77843 330.8218 155.31883" x="320.10638" y="155.31883" c="w"/>
<char bbox="414.0456 143.85785 422.4358 145.39825" x="414.0456" y="145.39825" c="œ"/>
<char bbox="450.9392 148.81815 459.3294 150.35855" x="450.9392" y="150.35855" c="œ"/>
<char bbox="487.98785 153.77843 496.37805 155.31883" x="487.98785" y="155.31883" c="œ"/>
<char bbox="524.8815 156.25856 533.27167 157.79897" x="524.8815" y="157.79897" c="œ"/>
不过看起来确实有一个bug,在char-bbox中urx值不正确,但在span-bbox中正确。您可能还需要查看此Adobe GitHub存储库:
afdko
子目录包含许多命令行工具,这些工具对于测试、检查和转换字体文件非常有用。我使用了本回购协议中的tx
工具,以便打印有关使用mutool extract
从以下文件中提取的字体文件的一些信息:
然后:
也许这个,或者这个回购中的其他28个命令行工具之一,也可以对你有用…
“你需要考虑什么是‘包围盒’”——谢谢你指出这一点。我刚刚编辑了这个问题来澄清。恐怕PDF规范中的描述已经相当好了。你可能想问一些具体的问题或分享你的(整理过的)代码进行分析,而不是等待别人重新制定规范。B你的起始位置看起来不太远(不同可能是因为不同的目标坐标系或选择的起始点),但你从中跨越的矩形看起来非常奇怪。<span bbox="39.21884 163.68216 42.53509 163.99687" font="PlantinMTStd-Regular" size="11.935925">
<char bbox="39.21884 163.68216 42.53509 163.99687" x="39.21884" y="163.99687" c=" "/>
<span bbox="57.200607 163.69899 73.08967 165.2394" font="OpusStd" size="19.841537">
<char bbox="57.200607 163.69899 73.08967 165.2394" x="57.200607" y="165.2394" c="&"/>
<char bbox="82.003044 151.29828 90.63545 152.83868" x="82.003044" y="152.83868" c="˙"/>
<char bbox="144.7842 161.21884 153.1744 162.75925" x="144.7842" y="162.75925" c="œ"/>
<char bbox="181.67781 166.17912 190.06801 167.71953" x="181.67781" y="167.71953" c="œ"/>
<char bbox="226.16718 173.61955 236.8826 175.15996" x="226.16718" y="175.15996" c="w"/>
<char bbox="320.10638 153.77843 330.8218 155.31883" x="320.10638" y="155.31883" c="w"/>
<char bbox="414.0456 143.85785 422.4358 145.39825" x="414.0456" y="145.39825" c="œ"/>
<char bbox="450.9392 148.81815 459.3294 150.35855" x="450.9392" y="150.35855" c="œ"/>
<char bbox="487.98785 153.77843 496.37805 155.31883" x="487.98785" y="155.31883" c="œ"/>
<char bbox="524.8815 156.25856 533.27167 157.79897" x="524.8815" y="157.79897" c="œ"/>
<page>
<span bbox="39 164 43 164" font="PlantinMTStd-Regular" size="11.9357">
<char bbox="39 164 39 164" c=" "/>
</span>
<span bbox="57 165 73 165" font="OpusStd" size="19.8411">
<char bbox="57 165 57 165" c="&"/>
</span>
<span bbox="82 153 91 153" font="OpusStd" size="19.8411">
<char bbox="82 153 82 153" c="˙"/>
</span>
<span bbox="145 163 153 163" font="OpusStd" size="19.8411">
<char bbox="145 163 145 163" c="œ"/>
</span>
<span bbox="182 168 190 168" font="OpusStd" size="19.8411">
<char bbox="182 168 182 168" c="œ"/>
</span>
<span bbox="226 175 237 175" font="OpusStd" size="19.8411">
<char bbox="226 175 226 175" c="w"/>
</span>
<span bbox="320 155 331 155" font="OpusStd" size="19.8411">
<char bbox="320 155 320 155" c="w"/>
</span>
<span bbox="414 145 422 145" font="OpusStd" size="19.8411">
<char bbox="414 145 414 145" c="œ"/>
</span>
<span bbox="451 150 459 150" font="OpusStd" size="19.8411">
<char bbox="451 150 451 150" c="œ"/>
</span>
<span bbox="488 155 496 155" font="OpusStd" size="19.8411">
<char bbox="488 155 488 155" c="œ"/>
</span>
<span bbox="525 158 533 158" font="OpusStd" size="19.8411">
<char bbox="525 158 525 158" c="œ"/>
</span>
</page>
$ mutool extract pdf_example.pdf
extracting font QNAAAA+PlantinMTStd-Regular-0013.ttf
extracting font QSAAAA+OpusStd-0018.ttf
$ tx -mtx QSAAAA+OpusStd-0018.ttf
tx: --- QSAAAA+OpusStd-0018.ttf
tx: (ttr) cmap table missing
### glyph[tag] {gname,enc,width,{left,bottom,right,top}}
glyph[0] {.notdef,-,0,{0,0,0,0}}
glyph[1] {g1,-,1640,{4,-1313,1489,2540}}
glyph[2] {g2,-,891,{0,-276,721,279}}
glyph[3] {g3,-,866,{0,-266,700,268}}
glyph[4] {g4,-,1106,{0,-276,953,276}}