是否有一个PDF库可以处理可访问性?

是否有一个PDF库可以处理可访问性?,pdf,metadata,accessibility,pdflib,Pdf,Metadata,Accessibility,Pdflib,我目前正在尝试解析PDF文件的语义结构。我相信添加元数据以使PDF可访问是正确的方法,但我找不到一个能干净地处理它的库 我在iOS上尝试过PDFLib TET,但我无法让它打开某些测试文档,它返回的错误太模糊,无法通过谷歌搜索 有没有其他库也这样做?我想看看pCOS库(也来自)。对于在PHP中的使用,您可以查看另一种选择。他们可能有一个工具用于此目的。解析语义的目标是什么?您正在呈现为HTML吗?需要更多解释。您希望在不存在的地方添加结构吗?什么库可以将某些文本字符串解释为h1或h2。。。还是将

我目前正在尝试解析PDF文件的语义结构。我相信添加元数据以使PDF可访问是正确的方法,但我找不到一个能干净地处理它的库

我在iOS上尝试过PDFLib TET,但我无法让它打开某些测试文档,它返回的错误太模糊,无法通过谷歌搜索


有没有其他库也这样做?

我想看看pCOS库(也来自)。对于在PHP中的使用,您可以查看另一种选择。他们可能有一个工具用于此目的。

解析语义的目标是什么?您正在呈现为HTML吗?需要更多解释。您希望在不存在的地方添加结构吗?什么库可以将某些文本字符串解释为h1或h2。。。还是将信息集合作为表格?如果您正在处理源内容,并且希望生成带标签的pdf,那么情况就不同了。正如@ckundo所说,我希望读取带标签的pdf并将其转换为HTML。