Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
是否有用于将文档从pdf转换为html的java库?_Java_Html_Pdf - Fatal编程技术网

是否有用于将文档从pdf转换为html的java库?

是否有用于将文档从pdf转换为html的java库?,java,html,pdf,Java,Html,Pdf,开源实现将是首选。只有我知道的才需要付费 显然,这不是一项容易的任务,PDF格式比HTML格式丰富得多(此外,您必须提取图像并链接它们,等等)。 简单的文本提取要简单得多(虽然不是琐碎的…。 我在你的问题的侧栏中看到了一个类似的问题:指向一个库(PopPube,它显然是用C++编写的,也许可以用JNI/JNA访问)和一个相关的问题,它提供了更多的答案。 < P>尝试从Apache基金会使用。< /P>我也想知道一个解决方案。PDFBox能够这样做(),但方式非常有限。

开源实现将是首选。

只有我知道的才需要付费



显然,这不是一项容易的任务,PDF格式比HTML格式丰富得多(此外,您必须提取图像并链接它们,等等)。
简单的文本提取要简单得多(虽然不是琐碎的…。

我在你的问题的侧栏中看到了一个类似的问题:指向一个库(PopPube,它显然是用C++编写的,也许可以用JNI/JNA访问)和一个相关的问题,它提供了更多的答案。

< P>尝试从Apache基金会使用。< /P>我也想知道一个解决方案。PDFBox能够这样做(),但方式非常有限。