Php 将PDF转换为HTML
将PDF文档转换为HTML在浏览器中查看的最佳解决方案是什么?该网站有几个PDF文档,访问者可以点击查看为HTML,这应该是一个HTML文件在屏幕上查看Php 将PDF转换为HTML,php,html,pdf,pdf-to-html,Php,Html,Pdf,Pdf To Html,将PDF文档转换为HTML在浏览器中查看的最佳解决方案是什么?该网站有几个PDF文档,访问者可以点击查看为HTML,这应该是一个HTML文件在屏幕上查看 运行PHP、Linux、Apache的标准网站。您是否考虑过将PDF数据保存在数据库中,然后根据访问者的选择动态创建PDF或html页面?如果您在托管提供商处具有命令行访问权限,则在poppler_utils包中有一个名为pdftohtml的实用程序 看起来很容易使用,没有从PHP内部调用它,但它应该可以工作。pdftohtml工作良好:快速
运行PHP、Linux、Apache的标准网站。您是否考虑过将PDF数据保存在数据库中,然后根据访问者的选择动态创建PDF或html页面?如果您在托管提供商处具有命令行访问权限,则在poppler_utils包中有一个名为pdftohtml的实用程序
看起来很容易使用,没有从PHP内部调用它,但它应该可以工作。pdftohtml工作良好:快速、稳定,但html结果最好是丑陋的。我已经在一个有很多工作简历的网站上用了很长时间了 然而,对于提取文本内容来说,这是一个很好的解决方案 我会试试看
或者谷歌应用程序文档API。谷歌在显示和转换pdf文件方面做得很好如果你准备从PHP调用Java,你可以看看你看过pdfjs了吗?对于科学论文来说,这看起来难以置信:@JDonner有一个警告:生成的HTML代码不可读,通常不可编辑,并且占用了兆字节的空间——至少对于我测试它的PDF(674.5 KiB PDF的2.8 MiB HTML)。如此大的尺寸尤其不利于服务,也不利于阅读(缓慢的滚动等)。@JDonner结果看起来不错,但html基本上是无用的——它将单词分开,将每个部分封装在不同的标签中,提取每个大小的字体(相同的字体)并嵌入其中,使文件变得巨大(如Ruslan所说)。您最好将PDF转换为PNG图像,而不是使用pdf2htmlEXpdftohtml,因为pdf2htmlEXpdftohtml不会保留样式。是的,每年3000美元的许可证。。。