C# 使用互操作将Word文档转换为HTML

C# 使用互操作将Word文档转换为HTML,c#,html,interop,ms-office,C#,Html,Interop,Ms Office,我知道interop的一个功能是将word文档保存到HTML中 但我的问题是它没有将列另存为列 这是我的文档的截图 这是保存为HTML时的输出 所以我想的是遍历word文档。检查对象是否为列,然后解析文本并在html输出中创建列 我之所以这样做,是因为我有一个将单词转换为Html的指导原则 如何遍历word文档?我正在解析文档中的单词,但在获取每个单词的格式时遇到问题 Application ap = new Application();

我知道interop的一个功能是将word文档保存到HTML中

但我的问题是它没有将列另存为列

这是我的文档的截图

这是保存为HTML时的输出

所以我想的是遍历word文档。检查对象是否为列,然后解析文本并在html输出中创建列

我之所以这样做,是因为我有一个将单词转换为Html的指导原则

如何遍历word文档?我正在解析文档中的单词,但在获取每个单词的格式时遇到问题

                Application ap = new Application();
                Document document = ap.Documents.Open(@"doc sample.doc");

                foreach (Microsoft.Office.Interop.Word.Paragraph paragraph in document.Paragraphs)
                {
                    string pText = paragraph.Range.Text;
                    Console.WriteLine("BOLD: " + paragraph.Range.Font.Bold);
                    Console.WriteLine(pText);
                }
                document.Close();
                ap.Quit();
代码的输出是

BOLD: 9999999 
And the text of the paragraph.
但并非该段中的所有文本都是粗体。如何检查段落中每个单词的格式

是否可以检查单词是否有列、表、形状、图像,并分析列、表中的单词

多谢各位