Pdf 获取有关嵌入式字体的信息
我正在使用pdf.js。获取带有字体信息的文本块Pdf 获取有关嵌入式字体的信息,pdf,pdf.js,Pdf,Pdf.js,我正在使用pdf.js。获取带有字体信息的文本块 Object { str: "blabla", dir: "ltr", width: 191.433141, height: 12.546, transform: Array[6], fontName: "g_d0_f2" } 是否有可能以某种方式获得有关g_d0_f2的更多信息。请注意,PDF.js getTextContent将不会也不会与PDF中的图示符匹配。PDF
Object {
str: "blabla",
dir: "ltr",
width: 191.433141,
height: 12.546,
transform: Array[6],
fontName: "g_d0_f2"
}
是否有可能以某种方式获得有关g_d0_f2的更多信息。请注意,PDF.js getTextContent将不会也不会与PDF中的图示符匹配。PDF32000规范有两种不同的文本显示和提取算法。即使您可以在page.commonObjs中查找字体数据,由于字形编码不匹配,它可能对提取的文本内容显示没有真正的帮助
页面的getTextContent正在执行文本提取和getOperatorList gets(glyph)显示操作符。查看src/display/svg.js呈现程序如何显示图示符。通过未记录的API,页面obj具有commonObjs属性()--您将获得ttf/otf数据,您可以对其进行解析并找到所需的所有信息:)