Marklogic仅通过内容处理框架转换我的一半文档

Marklogic仅通过内容处理框架转换我的一半文档,marklogic,Marklogic,我使用WebDAV服务器通过拖放将PDF、文档、PPTX和XLSX导入数据库。我的WebDAV服务器名为“CPF”,其根目录为“/”,端口号为“9999” 我用标准配置安装了内容处理框架 难道我没有必要的安全要求吗 对于这种情况,MarkLogic说: 在根目录上设置所需的权限 将文档添加到数据库以进行转换时,添加文档的用户必须具有添加和修改文档所需的权限。如果使用WebDAV服务器将文档拖放到数据库中,则WebDAV服务器的根目录还必须具有所需的权限 实现这些安全要求的一个简单方法是执行以下

我使用WebDAV服务器通过拖放将PDF、文档、PPTX和XLSX导入数据库。我的WebDAV服务器名为“CPF”,其根目录为“/”,端口号为“9999”

我用标准配置安装了内容处理框架

难道我没有必要的安全要求吗

对于这种情况,MarkLogic说:

在根目录上设置所需的权限

将文档添加到数据库以进行转换时,添加文档的用户必须具有添加和修改文档所需的权限。如果使用WebDAV服务器将文档拖放到数据库中,则WebDAV服务器的根目录还必须具有所需的权限

实现这些安全要求的一个简单方法是执行以下操作:

  • 为配置为WebDAV服务器根目录的URI创建URI权限

  • 创建一个具有URI权限和默认读取权限的角色。为角色插入和更新

  • 为您创建的角色在WebDAV根目录上设置权限。例如,如果您创建的角色名为webdav,并且根目录具有URI/webdav/root/,请(作为特权用户)运行类似于以下内容的查询:

您可以通过以下查询检查权限:

•将新角色(上例中的webdav)授予访问webdav服务器的用户

在这种情况下,我不知道他们在谈论哪个“角色”和哪个“根目录”?

但是如果错误来自其他地方怎么办?为什么有些文档被转换成.xml文件,有些文档被转换成.xhtml文件,而我的原始文件中有大约50%被忽略而没有转换?

正如Dave Cassel所建议的那样,我对一条处理失败的记录运行了
xdmp:document-properties()
。结果如下:

<?xml version="1.0" encoding="UTF-8"?>
<prop:properties xmlns:prop="http://marklogic.com/xdmp/property">
  <cpf:processing-status xmlns:cpf="http://marklogic.com/cpf">done</cpf:processing-status>
  <cpf:property-hash xmlns:cpf="http://marklogic.com/cpf">93bdf4b50736752e0155c8e16fd42544</cpf:property-hash>
  <cpf:last-updated xmlns:cpf="http://marklogic.com/cpf">2016-07-25T11:26:13.006+02:00</cpf:last-updated>
  <cpf:state xmlns:cpf="http://marklogic.com/cpf">http://marklogic.com/states/property-updated</cpf:state>
  <cpf:self xmlns:cpf="http://marklogic.com/cpf">/XXX/PDFs/XXXXX.pdf</cpf:self>
  <Win32CreationTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 08:05:44 GMT</Win32CreationTime>
  <Win32LastAccessTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 09:26:12 GMT</Win32LastAccessTime>
  <Win32FileAttributes xmlns="urn:schemas-microsoft-com:">00000000</Win32FileAttributes>
  <Win32LastModifiedTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 08:05:44 GMT</Win32LastModifiedTime>
</prop:properties>

完成
93BDF4B5073752E0155C8E16FD42544
2016-07-25T11:26:13.006+02:00
http://marklogic.com/states/property-updated
/XXX/PDFs/XXXXX.pdf
2016年7月25日星期一08:05:44 GMT
2016年7月25日星期一09:26:12 GMT
00000000
2016年7月25日星期一08:05:44 GMT

CPF在文档属性中存储有关状态更改和错误的信息。要诊断发生了什么,请转到查询控制台,并在未得到处理的文档之一上运行。这可能会告诉您错误是什么



查看您添加的属性,我看到状态为
http://marklogic.com/states/property-updated
我看到了一组Microsoft属性。查看通过管理UI的“内容处理安装”选项卡时得到的管道,该状态似乎是一条死胡同——也就是说,没有其他管道使用该状态作为起点。那么您是否有其他创建这些Microsoft属性的处理程序

CPF在文档属性中存储有关状态更改和错误的信息。要诊断发生了什么,请转到查询控制台,并在未得到处理的文档之一上运行。这可能会告诉您错误是什么


查看您添加的属性,我看到状态为
http://marklogic.com/states/property-updated
我看到了一组Microsoft属性。查看通过管理UI的“内容处理安装”选项卡时得到的管道,该状态似乎是一条死胡同——也就是说,没有其他管道使用该状态作为起点。那么您是否有其他创建这些Microsoft属性的处理程序

xdmp:document-get-permissions("/webdav/root/")
<?xml version="1.0" encoding="UTF-8"?>
<prop:properties xmlns:prop="http://marklogic.com/xdmp/property">
  <cpf:processing-status xmlns:cpf="http://marklogic.com/cpf">done</cpf:processing-status>
  <cpf:property-hash xmlns:cpf="http://marklogic.com/cpf">93bdf4b50736752e0155c8e16fd42544</cpf:property-hash>
  <cpf:last-updated xmlns:cpf="http://marklogic.com/cpf">2016-07-25T11:26:13.006+02:00</cpf:last-updated>
  <cpf:state xmlns:cpf="http://marklogic.com/cpf">http://marklogic.com/states/property-updated</cpf:state>
  <cpf:self xmlns:cpf="http://marklogic.com/cpf">/XXX/PDFs/XXXXX.pdf</cpf:self>
  <Win32CreationTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 08:05:44 GMT</Win32CreationTime>
  <Win32LastAccessTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 09:26:12 GMT</Win32LastAccessTime>
  <Win32FileAttributes xmlns="urn:schemas-microsoft-com:">00000000</Win32FileAttributes>
  <Win32LastModifiedTime xmlns="urn:schemas-microsoft-com:">Mon, 25 Jul 2016 08:05:44 GMT</Win32LastModifiedTime>
</prop:properties>