Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/76.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 从PDF转换为HTML_C#_Html_Pdf_Dll - Fatal编程技术网

C# 从PDF转换为HTML

C# 从PDF转换为HTML,c#,html,pdf,dll,C#,Html,Pdf,Dll,是否有一个.dll可以使用,它使用PDF文件作为输入,HTML文件作为输出? 我想从PDF转换成HTML。我的同事说,很难一步一步地从PDF中获取文本/字体/图像/页边距/链接等,然后创建具有相同内容的新HTML文件。他说这几乎是不可能的。所以我在想-如果有一些dll可以作为参考来做这件事吗?如果你不介意付费,Aspose提供了一个非常好的解决方案,这就是我们公司使用的 编写一个程序来完成它绝对不是一件小事。如果您找不到任何.NET库来执行此操作(我不能,至少不是免费的),我只需要通过编程方式调

是否有一个.dll可以使用,它使用PDF文件作为输入,HTML文件作为输出?
我想从PDF转换成HTML。我的同事说,很难一步一步地从PDF中获取文本/字体/图像/页边距/链接等,然后创建具有相同内容的新HTML文件。他说这几乎是不可能的。所以我在想-如果有一些dll可以作为参考来做这件事吗?

如果你不介意付费,Aspose提供了一个非常好的解决方案,这就是我们公司使用的


编写一个程序来完成它绝对不是一件小事。如果您找不到任何.NET库来执行此操作(我不能,至少不是免费的),我只需要通过编程方式调用它来获取html

如果您有空闲时间和/或PDFToHtml不能为您生成可接受的输出,您可以自己编写程序。这是一个非常成熟的免费pdf库。我过去曾使用它来操作PDF(合并、创建等)

更新


正如Quandary在评论中指出的,与iText提供的商业或AGPL许可证相比,该库提供了更宽松的许可证(MIT)。在选择图书馆时,请记住这一点。我自己还没有使用过PDFSharp库,我不知道它们在功能方面的比较。

您可以下载此免费工具:


然后在您的程序中,只需分叉一个新进程并运行传递PDF文件的可执行文件。我现在刚刚测试过,它似乎还可以工作。

它确实很复杂,但您为什么想要它?供应商提供了几种html-to-pdf转换工具,但我没有看到任何pdf-to-html。因为我不知道完整的版本可以导出为html,你应该先检查一下,看看结果。然后,也许您可以实现一些使用acrobat执行的批处理作业。只是一个想法…一个“将pdf转换为html”的web搜索将收集许多可能的解决方案。SO不是提供产品建议的好地方,因此投票以“不具建设性”结束。将pdf内容复制到word中,然后另存为html。这些亲密的狂热者将破坏SO。。。我理解这个问题是重复的,因为它已经被问了几次,但不是建设性的?真正地像这样(甚至更糟)的问题有数千个,因此被认为是有效的。您现在是否要关闭所有解决问题X的库请求?我们也是。此外,最近该产品出现了,为Aspose提供了类似的工具。Aspose没有广告那么容易工作,生成的html非常糟糕,此外,如果需要内存转换而不是文件,则需要先转换为doc,然后再转换为doc-htmli如果有人这样做,最好使用pdfsharp,在PDFSharp常见问题解答中,他们声明他们的库没有将PDF转换为HTML,他们也没有计划支持它。