Marklogic 管道PDF转换原始文档URI

Marklogic 管道PDF转换原始文档URI,marklogic,Marklogic,CPF为我将PDF转换为XHTML。这很好,当它在XHTML中时,我有另一个管道来丰富数据。这也很好 我注意到,我没有从PDF转换管道获取原始文档URI,只有XHTML文件的URI 我可以做的是使用replaces的构造转换XHTML URI,但我宁愿在所有管道中保留原始URI: /converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml into /pdf/Berry, Steve - Het Venetiaans bedrog.pd

CPF为我将PDF转换为XHTML。这很好,当它在XHTML中时,我有另一个管道来丰富数据。这也很好

我注意到,我没有从PDF转换管道获取原始文档URI,只有XHTML文件的URI

我可以做的是使用replaces的构造转换XHTML URI,但我宁愿在所有管道中保留原始URI:

/converted/Berry, Steve - Het Venetiaans bedrog_pdf.xhtml

into

/pdf/Berry, Steve - Het Venetiaans bedrog.pdf
我已经查看了
/MarkLogic/conversion/actions/convert pdf action.xqy
,但是我不清楚应该在哪里添加一些代码


欢迎任何意见

既然您已经在使用CPF,那么您已经有了属性片段。我建议您保留您可能想要作为财产的任何此类信息。同样,您也可以在第一步中添加一个集合,并将其复制到上一步中新创建的每个文档中


这两种方法中的任何一种都可能以原始URI作为排序规则ID的类型结束,因为您已经在使用CPF,那么您已经有了属性片段。我建议您保留您可能想要作为财产的任何此类信息。同样,您也可以在第一步中添加一个集合,并将其复制到上一步中新创建的每个文档中


这两种方法中的任何一种都可能以原始URI作为排序规则ID的一种类型而告终

谢谢,我从未意识到这些属性文档是由CPF创建的,源文档(原始URI)已经在其中:)而CPF对属性片段的使用正是我在某些情况下不使用它的原因。管道中的3-4个步骤可能会导致近12次提交,因为状态更改是CPF所有更改属性(这是事务性的)的一部分。这是一个很好的工具,但需要小心处理。CPF的其他用途是将文档添加到集合中,并将其视为队列,然后使用cORB[2]来完成繁重的工作。谢谢,我从未意识到这些属性文档是由CPF创建的,源文档(源URI)已经在其中:)而CPF对属性片段的使用是我在某些情况下不使用它的原因。管道中的3-4个步骤可能会导致近12次提交,因为状态更改是CPF所有更改属性(这是事务性的)的一部分。这是一个很好的工具,但需要小心处理。CPF的其他用途是将文档添加到集合中,并将其视为队列,然后使用cORB[2]来完成繁重的工作。