Pdf 将页面从文档提取到新文档

Pdf 将页面从文档提取到新文档,pdf,ms-word,pdf-generation,Pdf,Ms Word,Pdf Generation,我们正在开发一个打印服务器,允许用户上传文档并通过HP ePrint打印出来。它需要支持页面提取 我尝试使用宏(在Adobe Acrobat Reader Pro和MS Word的帮助下)将页面提取到PDF中。但事实证明,PDF的大小可能比预期的大 是否有任何方法可以从一个文档到另一个文档提取页面(不丢失格式-例如文档中的表格),从而使大小接近大小?这是一个困难的要求。听起来您一开始就遇到了两个问题(大PDF和格式丢失)。您可能应该更多地说明“提取”的含义,以及为什么PDF是您解决方案的一部分,

我们正在开发一个打印服务器,允许用户上传文档并通过HP ePrint打印出来。它需要支持页面提取

我尝试使用宏(在Adobe Acrobat Reader Pro和MS Word的帮助下)将页面提取到PDF中。但事实证明,PDF的大小可能比预期的大


是否有任何方法可以从一个文档到另一个文档提取页面(不丢失格式-例如文档中的表格),从而使大小接近大小?

这是一个困难的要求。听起来您一开始就遇到了两个问题(大PDF和格式丢失)。您可能应该更多地说明“提取”的含义,以及为什么PDF是您解决方案的一部分,因为这与“上传并打印”和“文档到文档”完全不同。这样,读者会有更多的建议给你


如果可能的话,我建议你试着从不同的角度来处理这个问题,因为我怀疑你不太可能获得一个好的、有效的、稳定的结果。一种可能的方法是将文档转换为PDF,然后在打印之前使用iText或其他PDF库处理PDF。这实际上取决于您试图实现的目标—提取/合并/转换的具体细节。

我同意这一点,并补充说,如果@SkyEagle888想要保留格式,请不要使用PDF。这是一种很好的格式,但一旦你使用它,每个元素的意义都消失了——它变成了一堆图形和文本元素。我已经有几年没有接触过MS Office了,但我个人会尝试使用VBA系统(现在是.net吗?)来提取页面内容。即使这是可能的,我也能预见到问题——文本通常是从一个页面流向下一个页面,因此如果您想按原样捕获页面,您必须获取文本/图形元素并手动将其复制到新文档中。有趣的问题!