将带有（有序）列表的docx转换为html_Html_Docx

将带有（有序）列表的docx转换为html

html

将带有（有序）列表的docx转换为html,html,docx,Html,Docx,我正在尝试将一个包含多个层的有序列表的大型docx文档转换为html。（请参见此处的文档示例：您应该下载它）我尝试了以下方法，包括：在线转换器，如html cleaner和index.html（仅识别列表的一层）另存为html-它创建了一个可怕的文件，但仍然无法识别ol结构将文件保存为zip，然后打开xml文件，但我看不到一种简单的方法可以从w:。。。标签将其保存到google文档并运行Omar Alzabir的脚本顺便说一句，如果我创建了一个具有多个层的有序列表的word文件

我正在尝试将一个包含多个层的有序列表的大型docx文档转换为html。（请参见此处的文档示例：您应该下载它）

我尝试了以下方法，包括：

在线转换器，如html cleaner和index.html（仅识别列表的一层）
另存为html-它创建了一个可怕的文件，但仍然无法识别ol结构
将文件保存为zip，然后打开xml文件，但我看不到一种简单的方法可以从w:。。。标签
将其保存到google文档并运行Omar Alzabir的脚本

顺便说一句，如果我创建了一个具有多个层的有序列表的word文件，并对其进行转换，它会将其识别为ol。但即使我“取消列表”并再次列出，现有文件也不会被识别为ol。因此，原始文档的创建方式可能有问题（？）

非常感谢的任何建议：）或关于此问题发生原因的指示

您可以使用

pandoc

：

这是一个开源通用命令行工具，用于转换标记源代码文档文件

您可以将其用作类似的内容：

  pandoc -o output.html input.docx

将其另存为.docx，然后查看works@Dipak我就是这么做的谢谢！实际上，对于创建它的示例文档，它是有效的，并且创建了ol标记。对于实际的大文档，ol标记无法识别，而是创建了带有数字1.2等硬编码的p标记。我可以看看是否可以为后一种情况创建更好的示例文档