Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/370.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/88.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 需要关于在web上显示(和/或转换)pdf文件的建议吗_Java_Html_Pdf_Struts 1 - Fatal编程技术网

Java 需要关于在web上显示(和/或转换)pdf文件的建议吗

Java 需要关于在web上显示(和/或转换)pdf文件的建议吗,java,html,pdf,struts-1,Java,Html,Pdf,Struts 1,首先是一些背景:我的网站有两种基本类型的用户。拥有免费帐户的用户可以上传文档,付费客户可以搜索、查看或下载这些文档。上传者只能查看他们自己的文档,而付费客户可以查看任何内容。目前我们只支持Word文档(或.doc或.docx)和纯文本。我们使用JODConverter库在Word和html之间进行转换;html是存储在数据库中并向用户显示的内容。 我们也想接受PDF,但我不确定显示PDF或将其转换为html的最佳方式是什么。我已经看到了使用谷歌文档进行动态转换的建议,但由于文档必须公开供谷歌访问

首先是一些背景:我的网站有两种基本类型的用户。拥有免费帐户的用户可以上传文档,付费客户可以搜索、查看或下载这些文档。上传者只能查看他们自己的文档,而付费客户可以查看任何内容。目前我们只支持Word文档(或.doc或.docx)和纯文本。我们使用JODConverter库在Word和html之间进行转换;html是存储在数据库中并向用户显示的内容。
我们也想接受PDF,但我不确定显示PDF或将其转换为html的最佳方式是什么。我已经看到了使用谷歌文档进行动态转换的建议,但由于文档必须公开供谷歌访问,因此适当限制访问似乎不可行——如果我错了,请纠正我。似乎简单地在html中使用标记(或类似PDFBox的东西)也会遇到同样的问题。
或者,我们可以忘记直接显示PDF文件并将其转换为html,就像我们处理Word文档一样,但我还没有找到一个外观不错的库。到目前为止,我所看到的一切似乎都在说,它并不能很好地完成转换工作,它只是一个窗口,并且/或者有一大笔许可费。(如果许可费不超过每年100美元左右,就不一定是交易的破坏者。)有人知道好的Java转换库吗?(如果通过命令行运行的东西确实做得很好,那么它是可以接受的。)

最后一件事,我们计划为付费客户提供下载原始PDF文件的选项。这可能很复杂吗?在构建流程的其余部分时,我是否应该记住什么

您可以通过以下工具将PDF转换为图像,而不是将PDF转换为HTML(这意味着某种OCR(识别文本)),并创建一个HTML页面,该页面按顺序链接到这些图像。因为这是java库,所以不仅仅是windows


下载原始PDF文件应该不会有问题。您只需在标题中将mimetype设置为标准PDF扩展名:application/PDF

我想这样的事情可以奏效;但是,我们的客户习惯于在查看文档时看到突出显示的搜索词。此外,它还将破坏从文档复制+粘贴的功能。当然,不管我最终采用什么解决方案,这都可能是一个问题。还有一个基于@mark的JPedal的商业PDF-to-HTML5转换器-你知道有谁实际使用过它吗?这个价格相当高,但如果它真的有效,我的老板可能会接受。