基于模式从pdf文件中删除页面的Perl脚本

基于模式从pdf文件中删除页面的Perl脚本,perl,pdf-generation,Perl,Pdf Generation,我们有一个3000页的PDF文件,我们想删除基于模式的页面 例如,PDF中找不到的页面有50页。现在,通过从文档中删除50页,输出将达到2950页。请尝试以下操作: use strict; use warnings; use CAM::PDF; my $pdf = CAM::PDF->new('input.pdf'); my $ttl_pgs = $pdf->numPages(); for(1..$ttl_pgs) { my $pagnum = $_; my $p

我们有一个3000页的PDF文件,我们想删除基于模式的页面


例如,PDF中找不到的页面有50页。现在,通过从文档中删除50页,输出将达到2950页。

请尝试以下操作:

use strict;
use warnings;
use CAM::PDF;

my $pdf = CAM::PDF->new('input.pdf');
my $ttl_pgs = $pdf->numPages();

for(1..$ttl_pgs)
{
    my $pagnum = $_;
    my $pdf_cnt = $pdf->getPageContent($pagnum);
    if($pdf_cnt=~m/pages not found/i)
    {
         $pdf->deletePage($pagnum);
    }
}
$pdf->cleanoutput('output.pdf');
我不明白“PDF中找不到的页面有50页”。请解释我认为“pagenot found”是pdf文件中的内容/文本。我可以纠正一下吗。