C# PDF到HTML转换API-使用C的最佳选项#

C# PDF到HTML转换API-使用C的最佳选项#,c#,html,pdf,C#,Html,Pdf,我想最好的方式和方法,从PDF转换为HTML,注意PDF包含不同的布局,智能艺术,图像。你能推荐一下吗?实际上,我更喜欢一个API,我可以在C#程序中使用它,从而以编程方式转换大量文件。我更喜欢转换图像并将其作为base64本身嵌入。不久前(2013年),我开发了一个PDF-to-epub(HTML的变体)转换器 我还想用C语言开发,并查看了可用的库,但最好的库是C/C++。你可能知道PDF是一种非常复杂的格式,即使是最好的转换器在某些文档上也会失败,所以你必须坚持使用最好的格式 从C++中,你

我想最好的方式和方法,从PDF转换为HTML,注意PDF包含不同的布局,智能艺术,图像。你能推荐一下吗?实际上,我更喜欢一个API,我可以在C#程序中使用它,从而以编程方式转换大量文件。我更喜欢转换图像并将其作为base64本身嵌入。不久前(2013年),我开发了一个PDF-to-epub(HTML的变体)转换器

我还想用C语言开发,并查看了可用的库,但最好的库是C/C++。你可能知道PDF是一种非常复杂的格式,即使是最好的转换器在某些文档上也会失败,所以你必须坚持使用最好的格式

从C++中,你可以很容易地调用C或C++函数,所以使用这些语言的库不是问题。 Poppler是我选择的PDF库:它基于Xpdf PDF viewer。它是可靠的,但无论如何,您都必须对HTML代码进行后处理。这个包包含命令行实用程序,包括pdftohtml,一个PDF到HTML的转换器。源文件也可用

另一个很好的选择是PDFLib:它是一种商业产品