是否有用于将文档从pdf转换为html的java库?
开源实现将是首选。只有我知道的才需要付费是否有用于将文档从pdf转换为html的java库?,java,html,pdf,Java,Html,Pdf,开源实现将是首选。只有我知道的才需要付费 显然,这不是一项容易的任务,PDF格式比HTML格式丰富得多(此外,您必须提取图像并链接它们,等等)。 简单的文本提取要简单得多(虽然不是琐碎的…。 我在你的问题的侧栏中看到了一个类似的问题:指向一个库(PopPube,它显然是用C++编写的,也许可以用JNI/JNA访问)和一个相关的问题,它提供了更多的答案。 < P>尝试从Apache基金会使用。< /P>我也想知道一个解决方案。PDFBox能够这样做(),但方式非常有限。
显然,这不是一项容易的任务,PDF格式比HTML格式丰富得多(此外,您必须提取图像并链接它们,等等)。
简单的文本提取要简单得多(虽然不是琐碎的…。
我在你的问题的侧栏中看到了一个类似的问题:指向一个库(PopPube,它显然是用C++编写的,也许可以用JNI/JNA访问)和一个相关的问题,它提供了更多的答案。 < P>尝试从Apache基金会使用。< /P>我也想知道一个解决方案。PDFBox能够这样做(),但方式非常有限。