Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/397.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 将格式化文本从pdf提取到html_Java_Html_Pdf - Fatal编程技术网

Java 将格式化文本从pdf提取到html

Java 将格式化文本从pdf提取到html,java,html,pdf,Java,Html,Pdf,我需要将PDF文档转换为HTML。在这里我可以实现以下目标 1-从PDF中提取文本 2-提取图像 3-在新转换的HTML页面中保留与PDF页面相同的格式 4-将图像嵌入到新转换的HTML页面的适当位置,如PDF 5-将颜色方案应用于HTML页面 任何帮助都将不胜感激。从PDF中提取图像 从PDF中提取文本的步骤 您正在寻找答案的所有其他事情都可以使用任何web应用程序设置。,您尝试过什么吗?可以这样做。iText只是从pdf生成纯文本,它不保持格式。iText保持格式,但它不保持格式,它只是转

我需要将PDF文档转换为HTML。在这里我可以实现以下目标

1-从PDF中提取文本

2-提取图像

3-在新转换的HTML页面中保留与PDF页面相同的格式

4-将图像嵌入到新转换的HTML页面的适当位置,如PDF

5-将颜色方案应用于HTML页面

任何帮助都将不胜感激。

从PDF中提取图像 从PDF中提取文本的步骤


您正在寻找答案的所有其他事情都可以使用任何web应用程序设置。,

您尝试过什么吗?可以这样做。iText只是从pdf生成纯文本,它不保持格式。iText保持格式,但它不保持格式,它只是转换文本。