Xquery marklogic数据从一个林复制到多个林

Xquery marklogic数据从一个林复制到多个林,xquery,marklogic,Xquery,Marklogic,我需要将Marklogic数据库内容(5000万xml文档)从一个数据库主机复制到另一个数据库主机。我们可以通过备份/恢复来实现这一点。但我需要将两个森林(每个森林2500万)中的可用数据复制到20个森林(每个森林250万)中,并将它们均匀分布。这可以使用xqsync或任何其他实用程序来完成吗?正如wst所指出的,默认情况下,对于新数据库,Marklogic 7将自动为您完成这项工作。对于从早期版本升级的数据库,需要从管理界面手动启用重新平衡。您可以在底部附近的“数据库配置”选项卡上找到该设置

我需要将Marklogic数据库内容(5000万xml文档)从一个数据库主机复制到另一个数据库主机。我们可以通过备份/恢复来实现这一点。但我需要将两个森林(每个森林2500万)中的可用数据复制到20个森林(每个森林250万)中,并将它们均匀分布。这可以使用xqsync或任何其他实用程序来完成吗?

正如wst所指出的,默认情况下,对于新数据库,Marklogic 7将自动为您完成这项工作。对于从早期版本升级的数据库,需要从管理界面手动启用重新平衡。您可以在底部附近的“数据库配置”选项卡上找到该设置

之后,您只需根据需要向数据库中添加新的林,并在稍有延迟(基于reindexer之类的限制级别)后自动触发重新分发,也可以访问集群。您可以在管理界面的数据库状态页面中执行重新平衡操作。可能需要一段时间,但它的设计运行在低干扰的背景

另一种方法几乎同样简单。转到“数据库”下的“林”页面,并选择要删除的林旁边的“已退休”。这会自动触发重新平衡文档,使其远离该林。完成后,只需将其与数据库分离

在这期间,所有数据都可以完全搜索和访问,尽管响应时间相对较慢,因为缓存也需要刷新


HTH

正如wst所指出的,默认情况下,对于新数据库,Marklogic 7将自动为您执行此操作。对于从早期版本升级的数据库,需要从管理界面手动启用重新平衡。您可以在底部附近的“数据库配置”选项卡上找到该设置

之后,您只需根据需要向数据库中添加新的林,并在稍有延迟(基于reindexer之类的限制级别)后自动触发重新分发,也可以访问集群。您可以在管理界面的数据库状态页面中执行重新平衡操作。可能需要一段时间,但它的设计运行在低干扰的背景

另一种方法几乎同样简单。转到“数据库”下的“林”页面,并选择要删除的林旁边的“已退休”。这会自动触发重新平衡文档,使其远离该林。完成后,只需将其与数据库分离

在这期间,所有数据都可以完全搜索和访问,尽管响应时间相对较慢,因为缓存也需要刷新


HTH

对于ML6或更早版本,我将使用“后退”和“恢复”来移动森林,然后重新平衡。之后,您可能需要强制合并,以除去原始林中已删除的片段。

对于ML6或更早版本,我将使用“后退”和“还原”移动林,然后重新平衡。之后,您可能需要强制合并,以除去原始林中已删除的片段。

本周我正在进行相同的迁移。从单个主机上的两个林到群集和六个林的1400万个文档。我们已经做了两次迁移的试运行,使用备份/恢复,然后重命名林,然后将新林添加到集群中。然后,我们使用CORB进行重新平衡。进行一些微调以优化线程数量,我们必须调整linux TCP超时,以确保CORB进程在重新平衡过程中不会部分失败。我认为我们最终使用了基于我们目前运行的非常旧版本的ML的CORB


如果您幸运地能够在ML7下运行,那么这一切都会容易得多,同时森林存储需求也会大大减少。

本周我正在进行同样的迁移。从单个主机上的两个林到群集和六个林的1400万个文档。我们已经做了两次迁移的试运行,使用备份/恢复,然后重命名林,然后将新林添加到集群中。然后,我们使用CORB进行重新平衡。进行一些微调以优化线程数量,我们必须调整linux TCP超时,以确保CORB进程在重新平衡过程中不会部分失败。我认为我们最终使用了基于我们目前运行的非常旧版本的ML的CORB


如果您幸运地能够在ML7下运行,那么这将非常容易,同时大大减少了林存储需求。

我认为XQSync将自动在所有可用的目标林中分发,除非另有规定。这可以通过一个小规模的测试来验证。另外,请参阅重新平衡新增加的森林。请注意,MarkLogic 7内置了森林再平衡功能。对于ML6和更早版本,我倾向于使用corb再平衡功能。设置起来可能有点麻烦,但效率要高得多。我认为XQSync将自动分布在所有可用的目标林中,除非另有规定。这可以通过一个小规模的测试来验证。另外,请参阅重新平衡新增加的森林。请注意,MarkLogic 7内置了森林再平衡功能。对于ML6和更早版本,我倾向于使用corb再平衡功能。设置起来可能有点麻烦,但效率要高得多。