Marklogic 使用CPF将单词和ppt转换为xml的操作模块

Marklogic 使用CPF将单词和ppt转换为xml的操作模块,marklogic,marklogic-8,Marklogic,Marklogic 8,我们是否可以使用CPF的管道功能将MS Word和powerpoint数据及元数据转换为xml 提前感谢简短的回答是可以转换为XML 较长的答案是,这取决于什么版本。任何通过word 2007的版本都已经是XML格式。它只是压缩了一下,里面有几个XML文档。PowerPoint也是如此。XML的格式可能很复杂,您很可能希望将其转换为更干净的版本 此外,最新版本的word有一个新的模式,因此XML的格式将有所不同 你可以先看看能给你什么。如果这还不够好,你可以用它自己写。由于单词file本身就是一

我们是否可以使用CPF的管道功能将MS Word和powerpoint数据及元数据转换为xml


提前感谢

简短的回答是可以转换为XML

较长的答案是,这取决于什么版本。任何通过word 2007的版本都已经是XML格式。它只是压缩了一下,里面有几个XML文档。PowerPoint也是如此。XML的格式可能很复杂,您很可能希望将其转换为更干净的版本

此外,最新版本的word有一个新的模式,因此XML的格式将有所不同

你可以先看看能给你什么。如果这还不够好,你可以用它自己写。由于单词file本身就是一个zip文件,您可以调用它,了解docx的组合方式,并决定如何对其进行转换


要使用CPF,您必须编写自己的操作模块,并配置CPF管道,使其具有步骤。

已有管道处理MS Office的压缩XML表单。将管道“Office OpenXML Extract”和“WordprocessingML进程”附加到您的域。您将无法获得从二进制(.doc)MS Word文档到DocBook的完全上转换,但是我们确实对XML进行了一些整理,您可以在末尾添加自己的转换。

您希望转换哪些版本的word和PowerPoint?第13版及以上版本我已经创建了管道:转换管道管道管道以测试CPF/MarkLogic/CPF/actions/success-action.xqy/MarkLogic/CPF/actions/failure-action.xqy将word转换为xml格式marklogic.com/states/initial marklogic.com/states/donemarklogic.com/states/error/convert-word-xml.xqy/convert-word-xml.xqy,但仍停留在convert-word-xml.xqy文件中编写的内容上,该文件将实际执行转换