使用Python从PDF文件中提取元数据信息并验证数字签名

使用Python从PDF文件中提取元数据信息并验证数字签名,python,pdf,encryption,certificate,digital-signature,Python,Pdf,Encryption,Certificate,Digital Signature,我正在尝试验证一个数字签名的PDF,并提取签名者的姓名。 在python中是否有用于执行此工作的库? 到目前为止,我刚刚遇到了Itext,但它是针对Java的。 这不是一个计算机视觉问题,因为你们中的一些人建议,基本上我想复制AdobeAcrobat对PDF的操作,它从证书中提取某些信息。 “签名存在检测”,这是可以做到的,甚至可以使用自定义视觉服务来完成。如果某些表单的签名旁边有预期的打印名称,则可以进一步使用。如果该问题可以被定义为“检测”问题,那么目前就更容易做到这一点。我已经在几个合作

我正在尝试验证一个数字签名的PDF,并提取签名者的姓名。 在python中是否有用于执行此工作的库? 到目前为止,我刚刚遇到了Itext,但它是针对Java的。 这不是一个计算机视觉问题,因为你们中的一些人建议,基本上我想复制AdobeAcrobat对PDF的操作,它从证书中提取某些信息。


“签名存在检测”,这是可以做到的,甚至可以使用自定义视觉服务来完成。如果某些表单的签名旁边有预期的打印名称,则可以进一步使用。如果该问题可以被定义为“检测”问题,那么目前就更容易做到这一点。我已经在几个合作伙伴处使用简单的技术(表单的边界框、自定义Vision NNs)实现了这一点


由于多种原因,这很难做到……因为人类拥有多个(版本)的签名等。你可以制作一个可工作的演示,但从我的经验来看,这并不是我真正想要的。

使用自定义视觉添加一个简单的边界框以提高准确性的高成功率的签名存在检测也很有效,只需几行代码即可完成。我在签名分类方面的唯一成功是当客户使用Autopen时(每个文件的签名都是一致的)@Ram但在我的情况下,它是编码的,这有关系吗?我在Poopler中看到了这个工具pdfsig,它似乎可以工作,但它是CMy的问题是,签名在文档中不是一个可视的东西,但它有散列的信息或PDF中的某些东西,只能通过Adobe Acrobat Reader和其他软件看到,这些软件告诉你证书是否有效是有效的,(我将在主要问题中上传一张图片,以便您查看),因此我必须提取此信息并存储签署PDF的公司名称,以便处理