用于PDF验证的iText API详细信息

用于PDF验证的iText API详细信息,itext,Itext,我将做一个案例研究,我需要用特定的标准验证PDF(例如,检查PDF中的内容是否具有特定的字体、字体大小、徽标位置)。所以我只想确认使用iTEXT是否可以获得这些PDF规范?如果是,iTEXT中使用的API是什么 注意:市场上还有其他工具可以实现这种功能吗?由于iText允许您直接访问所有PDF对象(字典、数组、流等等),它为您提供了所需的工具。但不要低估你的任务。根据你必须检查的标准,你可能有相当多的工作要做 例如,如果您的标准包括所有文本必须使用单个给定字体,您可以简单地解析整个文档文本并检查

我将做一个案例研究,我需要用特定的标准验证PDF(例如,检查PDF中的内容是否具有特定的字体、字体大小、徽标位置)。所以我只想确认使用iTEXT是否可以获得这些PDF规范?如果是,iTEXT中使用的API是什么


注意:市场上还有其他工具可以实现这种功能吗?

由于iText允许您直接访问所有PDF对象(字典、数组、流等等),它为您提供了所需的工具。但不要低估你的任务。根据你必须检查的标准,你可能有相当多的工作要做

例如,如果您的标准包括所有文本必须使用单个给定字体,您可以简单地解析整个文档文本并检查字体。另一方面,如果必须区分标题和标准文本,则需要引入一些启发式方法,因为通常标题不会标记为标题

你的支票必须有多好?如果字体字典中有所需的名称条目,或者您确实需要检查字体(可能是嵌入的字体子集)是否确实是所需的字体,这就足够了吗

你提到一个标志的位置。您如何识别徽标(与其他图形或图像相比)

因此,iText可以用作基础,但您必须事先进行大量思考。如果您决定认真使用iText,我建议您咨询

还有其他可用的PDF库和工具,包括免费(免费啤酒或免费speach)和商业版,它们提供了PDF分析框架。我主要使用的是iText,因此,我不太了解其他的内容

Ceterum censeo,您应该明确地查看PDF规范(特别是关于图形和文本的第8章和第9章),以了解PDF包含什么和不包含什么