将带有(有序)列表的docx转换为html
我正在尝试将一个包含多个层的有序列表的大型docx文档转换为html。(请参见此处的文档示例:您应该下载它) 我尝试了以下方法,包括:将带有(有序)列表的docx转换为html,html,docx,Html,Docx,我正在尝试将一个包含多个层的有序列表的大型docx文档转换为html。(请参见此处的文档示例:您应该下载它) 我尝试了以下方法,包括: 在线转换器,如html cleaner和index.html(仅识别列表的一层) 另存为html-它创建了一个可怕的文件,但仍然无法识别ol结构 将文件保存为zip,然后打开xml文件,但我看不到一种简单的方法可以从w:。。。标签 将其保存到google文档并运行Omar Alzabir的脚本 顺便说一句,如果我创建了一个具有多个层的有序列表的word文件
- 在线转换器,如html cleaner和index.html(仅识别列表的一层)
- 另存为html-它创建了一个可怕的文件,但仍然无法识别ol结构
- 将文件保存为zip,然后打开xml文件,但我看不到一种简单的方法可以从w:。。。标签
- 将其保存到google文档并运行Omar Alzabir的脚本
非常感谢的任何建议:)或关于此问题发生原因的指示您可以使用
pandoc
:
这是一个开源通用命令行工具,用于转换标记源代码文档文件
您可以将其用作类似的内容:
pandoc -o output.html input.docx
将其另存为.docx,然后查看works@Dipak我就是这么做的谢谢!实际上,对于创建它的示例文档,它是有效的,并且创建了ol标记。对于实际的大文档,ol标记无法识别,而是创建了带有数字1.2等硬编码的p标记。我可以看看是否可以为后一种情况创建更好的示例文档