如何将HTML文件转换为word?

如何将HTML文件转换为word?,html,ms-word,Html,Ms Word,我需要在内存中将HTML文档保存为Word.DOC文件 有人能给我一些到封闭源代码库和开放源代码库的链接吗 此外,我应该编辑此问题以添加我正在使用的语言,以便缩小选择范围。其他替代方法,而不仅仅是将文件重命名为.doc 这是一个好的开始。您还可以尝试使用此Office Open XML 一个好的选择是使用类似API的API。Docverter将允许您使用API将HTML转换为PDF或DOCX。执行此操作时,我发现最简单的方法是: 在web浏览器中访问该页面 使用扩展名为.htm的web浏览器以及

我需要在内存中将HTML文档保存为Word.DOC文件

有人能给我一些到封闭源代码库和开放源代码库的链接吗


此外,我应该编辑此问题以添加我正在使用的语言,以便缩小选择范围。

其他替代方法,而不仅仅是将文件重命名为.doc

这是一个好的开始。您还可以尝试使用此Office Open XML


一个好的选择是使用类似API的API。Docverter将允许您使用API将HTML转换为PDF或DOCX。

执行此操作时,我发现最简单的方法是:

在web浏览器中访问该页面 使用扩展名为.htm的web浏览器以及可能包含支持文件的文件夹保存页面 启动Word并打开保存的HTML文件Word将正确打开该文件 如果需要,进行任何编辑 选择另存为,然后选择要使用的扩展名doc、docx等。 试用

如果未明确指定输入或输出格式,pandoc将尝试从输入和输出文件名的扩展名中猜测该格式。 -潘多克手册

所以你甚至可以使用

pandoc -o output.docx input.html

就在php页面的开头。在此之前,任何代码都应该是最上面的代码

<?php
header("Content-Type: application/vnd.ms-word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc");

?>


这将把所有html转换成MSWORD,现在您可以根据客户的要求自定义它。

任何事情都有可能。你想在这上面花多少钱?现在是一个真正的问题。@Mask:是的,请指定你使用的语言。如果你想让这个词看起来和浏览器中呈现的html一模一样,那就很难了,除非你解析html并使用open office xml等库将其写入word格式,否则,您可能需要投资于商业转换器选项。我一直在寻找一个OSS解决方案,后来放弃了使用wkhtmltopdf将html转换成pdf,如果我需要编辑此文档,我可以使用PDF或foxit:@Mask You can try-这是一个由Microsoft员工编写的详细过程,详细描述了他如何通过C教程将自己的在线LINQ转换为格式良好的MS Word文档。你忘了完成答案吗?即使答案尚未完成,imo Docverter仍然被证明是本页中最有用的见解:docx4j ImportXHTML采用这种方法。Java代码,也可以在.NET环境中使用。我认为这个答案比重命名好,但这只是我的问题:如果你想要真正的转换,你可以尝试一个HTML到DOCX的API,就像这样:这个很好用。sudo易于安装-UbuntuI中的pandoc同意,如果您的目标比MS Word提供的稍多,这实际上是一个很好的解决方案-它还为您提供了一个通用工具,可在其他地方使用,例如从HTML转换为PDF等。。他说,对于一个真正基本的选择,d4nt建议的建议也很有效:这在我的情况下不起作用,请你更具体一点,@Beraliv。您是否从pandoc收到任何错误消息?Word不能打开文档吗?@Jan好的,抱歉没有解释。我试图表达这种转换并不理想:我不能以正确的方式转换公式,我是说所有公式,样式比我预期的更糟,文本的某些地方看起来很糟糕,偏移量、字体等等。。是的,我需要很多。但如果您使用仅限于PHP的phpNot,这是最好的。Word很乐意打开doc文件中的HTML内容,但不喜欢打开docx文件。希望我在花时间尝试以各种方式转换它之前就知道这一点。请注意,CSS支持是不确定的,您可能会也可能不会得到预期的可编辑结果。
<?php
header("Content-Type: application/vnd.ms-word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc");

?>