Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/javascript/429.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/319.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript Itext或Adobe Acrobat上的行距_Javascript_Java_Itext - Fatal编程技术网

Javascript Itext或Adobe Acrobat上的行距

Javascript Itext或Adobe Acrobat上的行距,javascript,java,itext,Javascript,Java,Itext,我可以更改现有PDF上的段落行间距吗?不是新的PDF。 请告诉我怎么换。各方面。谢谢。根据您的PDF文档是否被标记,以及您愿意在机器学习和人工智能方面投入多少精力,答案从“可能”到“不是一百万年” 让我解释一下 PDF文档主要是一组说明,告诉查看者如何呈现文档。它(通常)不包含任何逻辑结构。 因此,即使你(人类最终用户)能够清楚地看到一个段落,这并不意味着计算机能够分辨出文档的哪些部分构成了一个段落 如果您的文档已标记(意味着它具有此逻辑结构): 更改线高度可能需要再次执行布局 图像可能需要放

我可以更改现有PDF上的段落行间距吗?不是新的PDF。
请告诉我怎么换。各方面。谢谢。

根据您的PDF文档是否被标记,以及您愿意在机器学习和人工智能方面投入多少精力,答案从“可能”到“不是一百万年”

让我解释一下

PDF文档主要是一组说明,告诉查看者如何呈现文档。它(通常)不包含任何逻辑结构。 因此,即使你(人类最终用户)能够清楚地看到一个段落,这并不意味着计算机能够分辨出文档的哪些部分构成了一个段落

如果您的文档已标记(意味着它具有此逻辑结构):

  • 更改线高度可能需要再次执行布局
  • 图像可能需要放置在稍微不同的位置
  • 页面可能会溢出
  • 桌子可能不再合适了
您需要提供能够处理所有这些情况的代码。 这甚至是快乐的流

如果您的文档未标记,任务将变得更加困难。 让计算机识别原始PDF内容的结构是很困难的。这是许多PDF公司正在进行的研究任务。 你会发现很多关于这个主题的论文。大多数人倾向于提取单一类型的信息(如表、列表或文本),而不是所有信息


简而言之,答案可能不是

取决于您的PDF文档是否被标记,以及您愿意在机器学习和人工智能方面投入多少精力,答案从“可能”到“不是一百万年”

让我解释一下

PDF文档主要是一组说明,告诉查看者如何呈现文档。它(通常)不包含任何逻辑结构。 因此,即使你(人类最终用户)能够清楚地看到一个段落,这并不意味着计算机能够分辨出文档的哪些部分构成了一个段落

如果您的文档已标记(意味着它具有此逻辑结构):

  • 更改线高度可能需要再次执行布局
  • 图像可能需要放置在稍微不同的位置
  • 页面可能会溢出
  • 桌子可能不再合适了
您需要提供能够处理所有这些情况的代码。 这甚至是快乐的流

如果您的文档未标记,任务将变得更加困难。 让计算机识别原始PDF内容的结构是很困难的。这是许多PDF公司正在进行的研究任务。 你会发现很多关于这个主题的论文。大多数人倾向于提取单一类型的信息(如表、列表或文本),而不是所有信息


简而言之,答案可能不是

我想用手动方式改变。类似java或javascript。PDF通常是从HTML或Microsoft Word等可编辑文件格式转换而来。更改原始文档中的段落行距,然后再次转换。如果您没有原始的可编辑文件格式,请参阅Joris的答案。我希望使用手动方式进行更改。类似java或javascript。PDF通常是从HTML或Microsoft Word等可编辑文件格式转换而来。更改原始文档中的段落行距,然后再次转换。如果您没有原始的可编辑文件格式,请参阅Joris的答案。非常感谢。你的回答让我信服。非常感谢。你的回答使我信服。