Pdf 使用Acrobat动作脚本自动拆分、保存名称和错误检查?

Pdf 使用Acrobat动作脚本自动拆分、保存名称和错误检查?,pdf,automation,acrobat,Pdf,Automation,Acrobat,我正在考虑说服我的公司升级到Acrobat Pro,这样我就可以自动处理扫描的文档。在我提起之前,我想确定我想做的事情是可能的。我不需要任何人给我代码,我只想知道这是否可行 我处理的文档是横向的,2-5页,页脚中有文件名和页码。我想扫描一大叠,让脚本执行以下操作: 使用OCR获取每页的文件名和页码。我想限制OCR只看页脚,以节省时间和内存 使用文件名,我希望它能够检测一个文档何时结束,下一个文档何时开始,以便将它们拆分为单独的文件 保存拆分文件之前,请检查文件中的页数是否与页脚中的总页数匹配。(

我正在考虑说服我的公司升级到Acrobat Pro,这样我就可以自动处理扫描的文档。在我提起之前,我想确定我想做的事情是可能的。我不需要任何人给我代码,我只想知道这是否可行

我处理的文档是横向的,2-5页,页脚中有文件名和页码。我想扫描一大叠,让脚本执行以下操作:

  • 使用OCR获取每页的文件名和页码。我想限制OCR只看页脚,以节省时间和内存

  • 使用文件名,我希望它能够检测一个文档何时结束,下一个文档何时开始,以便将它们拆分为单独的文件

  • 保存拆分文件之前,请检查文件中的页数是否与页脚中的总页数匹配。(我在一家工厂工作,文件可能会变粘,所以我的扫描仪经常一次扫描两页)

  • 与其保存页面总数不匹配的文件,不如编译一个错误列表,以便我知道哪些文档需要重新扫描

  • 最后,将所有正确的文档及其文件名从页脚保存到“我的桌面”上的文件夹中


  • 这可以每周节省我几个小时,所以我希望这一切都是可能的。谢谢

    这不会很琐碎,但这是可能的。当页脚文件名相同,但OCR无法正确读取它们并将它们视为不同时,就会出现问题。你可以根据页码来测试,但是,这也不是小事。@joelgeraci我想我可以找到解决方法。Adobe支持论坛上有人告诉我,OCR不能局限于页脚,你知道这是真的吗?没错,你也不能将文本提取局限于页脚,但你可以决定只处理特定边界框中出现的单词。但正如我所说的,这并不是微不足道的,而且比答案所允许的要长得多。