iText 5能否将PDF转换为HTML?

iText 5能否将PDF转换为HTML?,html,pdf,itext,Html,Pdf,Itext,我使用iText 5创建了一个漂亮的报告,其中包括一些表格和图表。我想知道iText是否允许您将PDF转换为HTML,如果是的话。。怎么能做到呢 我相信以前的iText版本允许使用它,但在iText 5中我找不到这样做的方法。没有。iText从未将PDF转换为HTML,只是相反。你看过了吗?目前有一个免费的beta版。可以使用ApacheTika(它在引擎盖下使用ApachePDFBox): 你知道有哪个图书馆是这样的吗?我不知道。我对任何声称它可以。。。只是因为我知道这有多难。记住,不是“不可

我使用
iText 5
创建了一个漂亮的报告,其中包括一些表格和图表。我想知道iText是否允许您将PDF转换为HTML,如果是的话。。怎么能做到呢


我相信以前的
iText
版本允许使用它,但在
iText 5
中我找不到这样做的方法。

没有。iText从未将PDF转换为HTML,只是相反。

你看过了吗?目前有一个免费的beta版。

可以使用ApacheTika(它在引擎盖下使用ApachePDFBox):


你知道有哪个图书馆是这样的吗?我不知道。我对任何声称它可以。。。只是因为我知道这有多难。记住,不是“不可能”,只是很难。它可能适用于某些类别的PDF,但我怀疑总会有一些情况会欺骗它们。虽然iText不能做到这一点,但您可以使用任意一种PDF呈现器将这些页面转换为图像,然后将图像嵌入HTML页面。虽然有点笨重:没有文本选择,没有字段,大量带宽。
public String pdfToHtml(InputStream content) {
    PDDocument pddDocument = PDDocument.load(content);
    PDFText2HTML stripper = new PDFText2HTML("UTF-8");
    return stripper.getText(pddDocument);
}