使用pdftk从PDF解包附件时是否保留目录结构?

使用pdftk从PDF解包附件时是否保留目录结构?,pdf,attachment,directory-structure,pdftk,Pdf,Attachment,Directory Structure,Pdftk,我正在尝试使用pdftk将包含子目录层次结构的附件打包和解包到PDF。。。附加_文件和pdftk。。。解包_文件。但是,attach_files能够通过在文件名中包含/分隔符来表示子目录信息,unpack_files将所有文件放在一个平面目录中,如果同一名称多次出现,则会自动覆盖文件。解包时是否可以保留层次结构 作为解决办法,我使用了: 将附件打包到zip文件并附加zip文件。但是,通过这种方式,附件层次结构不再容易访问 对路径名应用双射变换,将层次结构映射到平面结构并返回。但是,这种解包方式

我正在尝试使用
pdftk将包含子目录层次结构的附件打包和解包到PDF。。。附加_文件
pdftk。。。解包_文件
。但是,
attach_files
能够通过在文件名中包含
/
分隔符来表示子目录信息,
unpack_files
将所有文件放在一个平面目录中,如果同一名称多次出现,则会自动覆盖文件。解包时是否可以保留层次结构

作为解决办法,我使用了:

  • 将附件打包到zip文件并附加zip文件。但是,通过这种方式,附件层次结构不再容易访问
  • 对路径名应用双射变换,将层次结构映射到平面结构并返回。但是,这种解包方式只有在脚本执行转换时才可能实现

最好能够直接保存PDF中已存储的层次结构信息。

不幸的是,当前版本的pdftk没有这样做,它被硬编码为在附加和解包文件时删除路径信息。事实上,如果使用pdftk将任何层次结构信息存储在PDF中,我会感到惊讶


尽管如此,编写一个补丁来改变这种行为并不难,我建议用一个功能请求来打开一个问题。

令人惊讶的是,层次结构信息目前由pdftk存储,尽管我怀疑它是通过将“带斜杠的字符串”存储为文件名来实现的。。。。事实证明,除了该项目中列出的作者电子邮件地址看起来已经死了之外,我找不到任何打开问题的方法,但在上有一个活动的fork(免责声明:我是它的维护者)