在php中解析包含特殊字体的PDF

在php中解析包含特殊字体的PDF,php,fonts,tcpdf,Php,Fonts,Tcpdf,我正在ZendFramework3项目中使用它来获取PDF文件的内容。到目前为止,使用的文件都是带有基本字体的PDF 1.3文件。但是文件创建的来源将很快更新,文件将是带有一些特定字体的PDF 1.5 尝试分析新文件时,我遇到以下错误: Object list not found. Possible secured file. 我试着转换成较低的PDF版本,可以解析文件。但是我从使用的特殊字体中得到了特殊字符的错误,因为我们有很多PDF文件,转换每个文件然后上传到我们的系统是不可行的 我还尝试

我正在ZendFramework3项目中使用它来获取PDF文件的内容。到目前为止,使用的文件都是带有基本字体的PDF 1.3文件。但是文件创建的来源将很快更新,文件将是带有一些特定字体的PDF 1.5

尝试分析新文件时,我遇到以下错误:

Object list not found. Possible secured file.
我试着转换成较低的PDF版本,可以解析文件。但是我从使用的特殊字体中得到了特殊字符的错误,因为我们有很多PDF文件,转换每个文件然后上传到我们的系统是不可行的

我还尝试将使用过的字体安装到tcpdf库中。错误依然存在

当创建一个基本字体的PDF 1.5时,我可以读取文件,因此我相当确信通过正确使用正确的字体或转换PDF中的字体可以解决错误

我发现有两种可能的解决方案。首先有人提到要将字体安装到tcpdf软件包中,虽然我不能100%确定我得到了所有字体,但已经完成了,但没有成功。。有没有办法用tcpdf调试这个问题

第二,有人提到

我更改了我感兴趣的转义序列的代码


这为他解决了问题。但是我不知道怎么做。

我最终使用ghostscript转换PDF

$cmd = 'gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dBATCH -dNOPAUSE -sOutputFile=' . $outputFile . ' ' . $inputFile;        
exec($cmd);