使用Javascript在PDF中查找结构元素

使用Javascript在PDF中查找结构元素,javascript,pdf,pdf.js,pdfjs,pdfjs-dist,Javascript,Pdf,Pdf.js,Pdfjs,Pdfjs Dist,我在一个试图解决PDF可访问性的项目中。我想在PDF的StructRootTree中的每个元素周围创建一个边界框。因此,我需要一种方法将PDF中的元素链接到标记树中的元素 有没有办法 a) 在PDF中查找属于StructElem的元素(位置、宽度、高度)?(StructElem->PDF元素) 或 b) 查找PDF中的所有元素,然后查找周围的StructElem?(PDF元素->结构元素) 我已经可以通过库阅读StructureTree了。我可以看到一个元素属于哪个页面,但看不到哪个元素。这将显

我在一个试图解决PDF可访问性的项目中。我想在PDF的StructRootTree中的每个元素周围创建一个边界框。因此,我需要一种方法将PDF中的元素链接到标记树中的元素

有没有办法

a) 在PDF中查找属于StructElem的元素(位置、宽度、高度)?(StructElem->PDF元素)

b) 查找PDF中的所有元素,然后查找周围的StructElem?(PDF元素->结构元素)

我已经可以通过库阅读StructureTree了。我可以看到一个元素属于哪个页面,但看不到哪个元素。这将显示StructRootTree的所有叶子:

我也能用英语阅读课文内容。但我似乎找不到如何将它们与Struct元素对齐。

我知道叶结构元素包含一个整数(在['/K']中,包含PDF中元素周围的MCID)。但要找到它,我需要解析页面的内容流。这对我来说似乎相当麻烦,而且非常容易出错。是否有API可以简化这一点

感谢您的帮助:)

我曾经