基于模式从pdf文件中删除页面的Perl脚本
我们有一个3000页的PDF文件,我们想删除基于模式的页面基于模式从pdf文件中删除页面的Perl脚本,perl,pdf-generation,Perl,Pdf Generation,我们有一个3000页的PDF文件,我们想删除基于模式的页面 例如,PDF中找不到的页面有50页。现在,通过从文档中删除50页,输出将达到2950页。请尝试以下操作: use strict; use warnings; use CAM::PDF; my $pdf = CAM::PDF->new('input.pdf'); my $ttl_pgs = $pdf->numPages(); for(1..$ttl_pgs) { my $pagnum = $_; my $p
例如,PDF中找不到的页面有50页。现在,通过从文档中删除50页,输出将达到2950页。请尝试以下操作:
use strict;
use warnings;
use CAM::PDF;
my $pdf = CAM::PDF->new('input.pdf');
my $ttl_pgs = $pdf->numPages();
for(1..$ttl_pgs)
{
my $pagnum = $_;
my $pdf_cnt = $pdf->getPageContent($pagnum);
if($pdf_cnt=~m/pages not found/i)
{
$pdf->deletePage($pagnum);
}
}
$pdf->cleanoutput('output.pdf');
我不明白“PDF中找不到的页面有50页”。请解释我认为“pagenot found”是pdf文件中的内容/文本。我可以纠正一下吗。