Itext 如何生成目录&x201C;TOC&x201D;from merged file.TOC应该是每个页面的标题

Itext 如何生成目录&x201C;TOC&x201D;from merged file.TOC应该是每个页面的标题,itext,Itext,如何从合并的文件中生成目录“TOC”。TOC应该是每一页的标题。我看过很多例子,所有TOC例子都是基于页码的。我使用文本pdf 5.5.11 我会尝试以下工作流程: 提取预期标题所在的文本 存储(字符串列表)所有标题及其对应的页面 在列表上循环,并将其展平(例如[TitleA,TitleA,TitleB,…]应变为[TitleA,TitleB]) 现在您有了关于每个标题首次出现的时间的信息 使用此信息构建TOC 如果您的文档被标记,则可以更频繁地执行此操作(考虑到使用标题的大致位置并简单地提取文

如何从合并的文件中生成目录“TOC”。TOC应该是每一页的标题。我看过很多例子,所有TOC例子都是基于页码的。我使用文本pdf 5.5.11


我会尝试以下工作流程:

  • 提取预期标题所在的文本
  • 存储(字符串列表)所有标题及其对应的页面
  • 在列表上循环,并将其展平(例如[TitleA,TitleA,TitleB,…]应变为[TitleA,TitleB])
  • 现在您有了关于每个标题首次出现的时间的信息
  • 使用此信息构建TOC

  • 如果您的文档被标记,则可以更频繁地执行此操作(考虑到使用标题的大致位置并简单地提取文本有点启发性)

    我将尝试以下工作流:

  • 提取预期标题所在的文本
  • 存储(字符串列表)所有标题及其对应的页面
  • 在列表上循环,并将其展平(例如[TitleA,TitleA,TitleB,…]应变为[TitleA,TitleB])
  • 现在您有了关于每个标题首次出现的时间的信息
  • 使用此信息构建TOC

  • 如果您的文档被标记,则可以更频繁地进行标记(考虑到使用标题的大致位置和简单地提取文本有点启发性)

    您可以从哪种形式获得构建TOC的信息?您已经看到了许多示例,但您尝试了什么?结果如何?和你期望的有什么不同?你写“TOC应该是每一页的标题”是什么意思?TOC是“目录”的缩写。你是说你希望TOC作为每一页的标题被重复?你能详细说明一下吗,因为我不明白为什么会有人想要这样。我已经尝试过了。TOC是基于页码的。我的期望是TOC类似于“第5.1.1节页面”当我单击此TOC时,将导航到一个有此标题的页面。我试图从合并的pdf文件中创建TOC。您以何种形式获得构建TOC的信息?您已经看到了许多示例,但您尝试了什么?结果如何?和你期望的有什么不同?你写“TOC应该是每一页的标题”是什么意思?TOC是“目录”的缩写。你是说你希望TOC作为每一页的标题被重复?你能详细说明一下吗,因为我不明白为什么会有人想要这样。我已经尝试过了。TOC是以页码为基础工作的。我的期望是,当我点击这个TOC时,它会导航到一个有这个标题的页面,我试图从合并的pdf文件创建TOC