C# 用于将Word文档文本转换为HTML的库
是否有一个.Net开源库将word文档转换为HTML以显示在网页内 我知道几种将word文档转换为html文件的工具,但我的要求是在ASP.Net应用程序中动态地将文档(从文件或刚刚提取的文本)转换为htmlC# 用于将Word文档文本转换为HTML的库,c#,asp.net,html,ms-word,C#,Asp.net,Html,Ms Word,是否有一个.Net开源库将word文档转换为HTML以显示在网页内 我知道几种将word文档转换为html文件的工具,但我的要求是在ASP.Net应用程序中动态地将文档(从文件或刚刚提取的文本)转换为html 我发现PHP库也做了同样的事情,在.net中有类似的工具吗?你只是想把一个*.doc文件转换成HTML?将其保存为HTML文件是一个选项吗 标准的.SaveAs方法可以选择另存为HTML: wdFormatHTML使用HTML标记保存所有文本和格式,以便在Web浏览器中查看生成的文档 发件
我发现PHP库也做了同样的事情,在.net中有类似的工具吗?你只是想把一个*.doc文件转换成HTML?将其保存为HTML文件是一个选项吗 标准的
.SaveAs
方法可以选择另存为HTML:
wdFormatHTML使用HTML标记保存所有文本和格式,以便在Web浏览器中查看生成的文档
发件人:
有关如何使用该方法将.doc转换为其他格式的示例教程,您可以在此处找到:
如果您有*.docx文件而不是*.doc文件,那么就更容易了,因为您可以使用OpenXML API,如MSDN中所述:。如果您获得Word文件的XML,当然可以将其输出为您想要的任何格式(HTML)。在和OpenOffice的帮助下,将您的文档文件转换为pdf 请参阅以供参考 然后使用pdftohtml(),这是一个将PDF文件转换为HTML的实用程序
你会得到惊人的结果 为什么不转换成一个文件,然后读取HTML文件呢?是的,如果没有办法,这是最后一个选项,目前我们正在数据库中将文档存储为blob,所以,将其转换为HTML字符串比将blob存储到文件系统作为文档和启动word interop以另存为HTML,然后从应用程序读取它更方便…是的,我知道这个解决方案…很好。它回答了你的问题还是我遗漏了什么?