Marklogic 带MLCP的EPUB加载

Marklogic 带MLCP的EPUB加载,marklogic,epub,mlcp,Marklogic,Epub,Mlcp,MarkLogic不“处理”EPUB。中央公积金没有。MLCP没有 EPUB是一个主要包含xhtml、xml和图片的zip。我可以将它重命名为.zip并用MLCP加载它。但是重命名并不是很好,它会出现在URI中,除非我在URI创建中添加替换等 另外,.opf文件包含有用的信息,它是XML,但读作二进制。我可以将.OPF添加到MIME类型中,但这与使用MLCP从存档加载的组合不起作用,那么它仍然会再次显示为二进制文件 我不喜欢在数据加载到ML之前添加一个额外的层来“准备”数据。我希望尽可能保持信息

MarkLogic不“处理”EPUB。中央公积金没有。MLCP没有

EPUB是一个主要包含xhtml、xml和图片的zip。我可以将它重命名为.zip并用MLCP加载它。但是重命名并不是很好,它会出现在URI中,除非我在URI创建中添加替换等

另外,
.opf
文件包含有用的信息,它是XML,但读作二进制。我可以将.OPF添加到MIME类型中,但这与使用MLCP从存档加载的组合不起作用,那么它仍然会再次显示为二进制文件

我不喜欢在数据加载到ML之前添加一个额外的层来“准备”数据。我希望尽可能保持信息的可读性/可索引性


有没有比这更好的方法;重命名、解包和mime键入以将EPUB文件加载到MarkLogic?

我个人认为应该使用MLCP转换。您知道它是压缩数据,因此您可以在转换中安全地应用
xdmp:zip清单
。您可以在转换中发出多个map:map对象,每个部分在epub-zip中具有uri/值。您可以使用选项告诉
xdmp:zip get
以特定格式读取特定文件


我想我个人应该使用MLCP变换。您知道它是压缩数据,因此您可以在转换中安全地应用
xdmp:zip清单
。您可以在转换中发出多个map:map对象,每个部分在epub-zip中具有uri/值。您可以使用选项告诉
xdmp:zip get
以特定格式读取特定文件


要将.opf文件作为单个文档加载到数据库中,还是希望mlcp为您解包并将包含的XHTML、XML和图像文件作为单个文档插入到数据库中

如果是后者,您可能可以通过使用-input\u compression\u codec选项来实现它(无需重命名源文件)。请参阅文档中的此主题:


您希望将.opf文件作为单个文档加载到数据库中,还是希望mlcp为您解包并将包含的XHTML、XML和图像文件作为单个文档插入到数据库中

如果是后者,您可能可以通过使用-input\u compression\u codec选项来实现它(无需重命名源文件)。请参阅文档中的此主题:


有趣!谢谢我可能会使用前面提到的
transform
方法grtjn,这样我也可以按原样加载EPUB文件,所有的工作都在服务器端完成。有趣!谢谢我可能会使用前面提到的
transform
方法grtjn,这样我也可以按原样加载EPUB文件,所有的工作都在服务器端完成。我在玩这个,效果很好,但我不使用maps,因为我不确定它是否可以保存EPUB文件中的二进制文件(JPG)。我在玩这个,工作得很好,但我不使用maps,因为我不确定它是否可以保存EPUB文件中的二进制文件(JPG)。