Xquery 如何上传docx、xlsx&;txt文件到Marklogic服务器?

Xquery 如何上传docx、xlsx&;txt文件到Marklogic服务器?,xquery,marklogic,Xquery,Marklogic,我有一个包含doc、docx、xlsx、pdf和txt文件的文件夹。我正在使用此XQuery将所有这些文件上载到Marklogic中:- for $d in xdmp:filesystem-directory("C:\uploads")//dir:entry return xdmp:document-load($d//dir:pathname, <options xmlns="xdmp:document-load"> <uri>{concat("/d

我有一个包含doc、docx、xlsx、pdf和txt文件的文件夹。我正在使用此XQuery将所有这些文件上载到Marklogic中:-

for $d in xdmp:filesystem-directory("C:\uploads")//dir:entry
return 
  xdmp:document-load($d//dir:pathname,
    <options xmlns="xdmp:document-load">
    <uri>{concat("/documents/", string($d//dir:filename))}</uri>
    <permissions>{xdmp:default-permissions()}</permissions>
    <collections>{xdmp:default-collections()}</collections>
    <format>binary</format>
    </options>)
xdmp:filesystem目录中$d的
(“C:\uploads”)//dir:entry
返回
xdmp:文档加载($d//dir:pathname,
{concat(“/documents/”,字符串($d//dir:filename))}
{xdmp:default-permissions()}
{xdmp:default-collections()}
二元的
)

我还为我的数据库安装了内容处理。现在,当我上传doc和pdf文件时,它们被转换成xml和xhtml文件。但是docx、xlsx和txt不会被转换。有人能告诉我为什么这些文件没有被转换吗?

启用Office OpenXML提取管道来转换.docx、.xlsx和.pptx文件

具有这些扩展名的文件已经是XML。如果将其扩展名更改为.zip,则可以提取并看到文件只是由相互关联的XML部分组成

Office OpenXML解压缩管道将解压缩Office 2007/2010文件,并将其必要部分存储在主文件的同级目录中,类似于其他转换管道。此管道允许您存储原始的开放XML。目前没有进一步转换到DocBook的XHTML

据我所知,没有对.txt的转换。这些只是文本文件,将作为文本插入MarkLogic。只需将文本包装在父元素中并将文件扩展名更改为.XML,即可将其转换为XML


希望这有帮助。

启用Office OpenXML提取管道来转换.docx、.xlsx和.pptx文件

具有这些扩展名的文件已经是XML。如果将其扩展名更改为.zip,则可以提取并看到文件只是由相互关联的XML部分组成

Office OpenXML解压缩管道将解压缩Office 2007/2010文件,并将其必要部分存储在主文件的同级目录中,类似于其他转换管道。此管道允许您存储原始的开放XML。目前没有进一步转换到DocBook的XHTML

据我所知,没有对.txt的转换。这些只是文本文件,将作为文本插入MarkLogic。只需将文本包装在父元素中并将文件扩展名更改为.XML,即可将其转换为XML


希望这有帮助。

为什么要转换txt文件?因为我想用search:search API在文本文件中搜索。为什么要转换txt文件?因为我想用search:search API在文本文件中搜索。