Javascript 如何显示html格式的PDF并获取格式化的html?

Javascript 如何显示html格式的PDF并获取格式化的html?,javascript,pdf,pdf.js,pdfjs,pdf-to-html,Javascript,Pdf,Pdf.js,Pdfjs,Pdf To Html,我需要在浏览器中显示html格式的PDF,并选择、复制和编辑格式化的html 到目前为止,我尝试了来自mozilla的pdftohtml命令行实用程序和pdf.js平台。我似乎不能用一个实用程序很好地完成两个任务。例如,我可以使用pdf.js非常精确地显示pdf,但我无法生成格式化的文本层,为选择文本而创建的覆盖仅具有定位样式,而没有字体样式 解决此问题的最佳方法是什么?PDF.js还有一个SVG后端。转换为格式化的HTML需要丢失精确的字符位置,这不是一件小事。最好的方法是为PDF.js项目做

我需要在浏览器中显示html格式的PDF,并选择、复制和编辑格式化的html

到目前为止,我尝试了来自mozilla的pdftohtml命令行实用程序和pdf.js平台。我似乎不能用一个实用程序很好地完成两个任务。例如,我可以使用pdf.js非常精确地显示pdf,但我无法生成格式化的文本层,为选择文本而创建的覆盖仅具有定位样式,而没有字体样式


解决此问题的最佳方法是什么?

PDF.js还有一个SVG后端。转换为格式化的HTML需要丢失精确的字符位置,这不是一件小事。最好的方法是为PDF.js项目做贡献。我想你是对的。从svg中提取样式可能更容易。我会试试看。谢谢你的提示!