Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Php 将PDF转换为HTML_Php_Html_Pdf_Pdf To Html - Fatal编程技术网

Php 将PDF转换为HTML

Php 将PDF转换为HTML,php,html,pdf,pdf-to-html,Php,Html,Pdf,Pdf To Html,将PDF文档转换为HTML在浏览器中查看的最佳解决方案是什么?该网站有几个PDF文档,访问者可以点击查看为HTML,这应该是一个HTML文件在屏幕上查看 运行PHP、Linux、Apache的标准网站。您是否考虑过将PDF数据保存在数据库中,然后根据访问者的选择动态创建PDF或html页面?如果您在托管提供商处具有命令行访问权限,则在poppler_utils包中有一个名为pdftohtml的实用程序 看起来很容易使用,没有从PHP内部调用它,但它应该可以工作。pdftohtml工作良好:快速

将PDF文档转换为HTML在浏览器中查看的最佳解决方案是什么?该网站有几个PDF文档,访问者可以点击查看为HTML,这应该是一个HTML文件在屏幕上查看


运行PHP、Linux、Apache的标准网站。

您是否考虑过将PDF数据保存在数据库中,然后根据访问者的选择动态创建PDF或html页面?

如果您在托管提供商处具有命令行访问权限,则在poppler_utils包中有一个名为pdftohtml的实用程序


看起来很容易使用,没有从PHP内部调用它,但它应该可以工作。

pdftohtml工作良好:快速、稳定,但html结果最好是丑陋的。我已经在一个有很多工作简历的网站上用了很长时间了

然而,对于提取文本内容来说,这是一个很好的解决方案

我会试试看


或者谷歌应用程序文档API。谷歌在显示和转换pdf文件方面做得很好

如果你准备从PHP调用Java,你可以看看

你看过pdfjs了吗?对于科学论文来说,这看起来难以置信:@JDonner有一个警告:生成的HTML代码不可读,通常不可编辑,并且占用了兆字节的空间——至少对于我测试它的PDF(674.5 KiB PDF的2.8 MiB HTML)。如此大的尺寸尤其不利于服务,也不利于阅读(缓慢的滚动等)。@JDonner结果看起来不错,但html基本上是无用的——它将单词分开,将每个部分封装在不同的标签中,提取每个大小的字体(相同的字体)并嵌入其中,使文件变得巨大(如Ruslan所说)。您最好将PDF转换为PNG图像,而不是使用pdf2htmlEXpdftohtml,因为pdf2htmlEXpdftohtml不会保留样式。是的,每年3000美元的许可证。。。