如何使用Java将HTML网页转换为PDF文件

如何使用Java将HTML网页转换为PDF文件,java,pdf,Java,Pdf,我一直在互联网上搜索如何使用Java将HTML页面转换为PDF文件。我发现了很多指针,简言之,它们不起作用或者太难实现。我还下载了一个商业产品pdf4ml;API是我很乐意使用的东西,除了当我在wikipedia上爬网一个简单的页面时,我得到一个内存不足错误(将Xmx设置为1024m)。在某些方法中,他们建议转换HTML->XHTML->FO->PDF。但是,对于XHTML到FOXLS文件,我遇到了很多异常;阅读这些文件,我现在没有足够的时间去理解 以下是我的问题/担忧。 1.是否有另一个内聚A

我一直在互联网上搜索如何使用Java将HTML页面转换为PDF文件。我发现了很多指针,简言之,它们不起作用或者太难实现。我还下载了一个商业产品pdf4ml;API是我很乐意使用的东西,除了当我在wikipedia上爬网一个简单的页面时,我得到一个内存不足错误(将Xmx设置为1024m)。在某些方法中,他们建议转换HTML->XHTML->FO->PDF。但是,对于XHTML到FOXLS文件,我遇到了很多异常;阅读这些文件,我现在没有足够的时间去理解

以下是我的问题/担忧。 1.是否有另一个内聚API可以轻松地将HTML转换为PDF(商业版或非商业版)? 2.有没有一种方法可以简单地捕获HTML页面并将其存储为单个文件。这种方法类似于使用internet explorer的方式将网页保存为web存档(单文件,MHT格式)


感谢您的帮助。(顺便说一句,我知道这个问题已经被反复问过了,但是除了这个问题最初的精神之外,我对其他方式持开放态度)。谢谢。

我的2美分使用开源工具:

您可以使用或将html页面的屏幕截图保存在Java代码中的图像文件中。一旦你有了图像文件,你就可以了

编辑: 似乎您可以在一个步骤中使用

完成所有这些,您可以使用开源Java lib,然后阅读

或者使用开源Java库

或者借助流行的开源库来实现这一点

或者使用,但不是免费的,只是试用


或者使用,而且是人做的。

我不确定,但你可以试试

1) cobra html呈现引擎

2) htmleditorkit——jdk的一部分

3) JWeb页

使用呈现工具包解析和呈现html。渲染输出是一个swing组件。itext可以使用Swing组件生成pdf文件输出,这是使用WebKit的。另一个选项(我目前正在使用)是使用OpenOffice(通过宏进行远程控制)。

您可以尝试一下。它是一个易于使用的商业在线API,具有许多选项,并支持Java


它可以从网页或原始HTML代码创建PDF。

除了自动化之外,您还可以使用BullZip PDF打印机将HTML页面打印为PDF。这大约是第一百次提出“HTML->PDF in java”问题。堆栈溢出存在的部分原因是,您可以检查以前提出的问题的答案。这样做吧。这个选择太棒了!Webkit在HTML5+CSS3渲染方面做得很好。不幸的是,Pdfcrowd不是免费的。