C# 解析word文档

C# 解析word文档,c#,sharepoint-2010,C#,Sharepoint 2010,我要解析的word文档将具有由word模板定义的已知格式。用户将使用word模板创建文档。我需要使用C#解析word文档中的数据,包括下拉列表中的值。这将在SharePoint 2010服务器上完成。推荐的方法是什么?我见过有人提到OpenXMLSDK2.0;我应该用这个吗?如果是这样,我是否需要将.docx转换为XML,然后解析它?在某些情况下,我还必须向Word文档中写入内容,这应该如何完成 最好的解决方案将支持Word 2010和2007,但如果2010年的工具明显更好,我也想知道这一点。

我要解析的word文档将具有由word模板定义的已知格式。用户将使用word模板创建文档。我需要使用C#解析word文档中的数据,包括下拉列表中的值。这将在SharePoint 2010服务器上完成。推荐的方法是什么?我见过有人提到OpenXMLSDK2.0;我应该用这个吗?如果是这样,我是否需要将.docx转换为XML,然后解析它?在某些情况下,我还必须向Word文档中写入内容,这应该如何完成


最好的解决方案将支持Word 2010和2007,但如果2010年的工具明显更好,我也想知道这一点。谢谢。

Office Open XML的文件扩展名是.docx。docx文件可以描述为几个不同文件的存档。处理word文档中将存在的字体、样式和对象的文件。这些文件本身将被描述为XML。

Office Open XML的文件扩展名是.docx。docx文件可以描述为几个不同文件的存档。处理word文档中将存在的字体、样式和对象的文件。这些文件本身将被描述为XML。

因为我们讨论的是Sharepoint,所以我将简单地使用它:或者按照您自己的建议使用OpenXMLSDK。如果您想同时支持2010和2007,我会尽量避免使用2010功能,以保持两个版本之间的兼容性。@ramhound我的困惑之一是Word.docx不是或看起来不像XML文档。如何将它作为一个开放XML..使用。。?关于这方面的研究的链接或术语?谢谢感谢您的回复。请注意,Visual Studio Tools for Office使用Word对象模型(用于Office工具的Word部分)@凯勒姆:它是XML,但它被压缩以节省空间。尝试将文件扩展名更改为.zip并将其打开。因为我们讨论的是Sharepoint,所以我将简单地使用:或者按照您的建议使用OpenXMLSDK。如果您想同时支持2010和2007,我会尽量避免使用2010功能,以保持两个版本之间的兼容性。@ramhound我的困惑之一是Word.docx不是或看起来不像XML文档。如何将它作为一个开放XML..使用。。?关于这方面的研究的链接或术语?谢谢感谢您的回复。请注意,Visual Studio Tools for Office使用Word对象模型(用于Office工具的Word部分)@凯勒姆:它是XML,但它被压缩以节省空间。尝试将文件扩展名更改为.zip并将其打开。