使用MarkLogic构建集群时的分布式处理

使用MarkLogic构建集群时的分布式处理,marklogic,Marklogic,目前,我有一个使用MarkLogic构建的集群。 我正在从PC1和PC2中的两个构建一个集群。 这两个窗口都是 所以有一个问题 从一个数字到两分钟,我想确认处理速度很快 通过向PC1创建DB来创建forest1。 我将创建一个forest2到PC2 在这种情况下,如果参考过程中的建议从PC1返回forest1,2 正在处理或将被分发 我不知道forest1,PC2是否是美国播放的每个参考处理forest2到PC1 此外,感谢您或任何人的回复。有些“处理”是分布式的,有些则不是。 大致上,如果您正

目前,我有一个使用MarkLogic构建的集群。 我正在从PC1和PC2中的两个构建一个集群。 这两个窗口都是

所以有一个问题

从一个数字到两分钟,我想确认处理速度很快

通过向PC1创建DB来创建forest1。 我将创建一个forest2到PC2

在这种情况下,如果参考过程中的建议从PC1返回forest1,2 正在处理或将被分发

我不知道forest1,PC2是否是美国播放的每个参考处理forest2到PC1

此外,感谢您或任何人的回复。

有些“处理”是分布式的,有些则不是。 大致上,如果您正在执行“搜索”,并且文档位于一个在多台主机上具有林的数据库中,那么大部分搜索处理都是分布式的。与存储文档类似——如果存储1000个文档,它们将分布在可用的林中,大量“处理”也将分布

另一方面,如果您运行一个非面向数据库的函数,比如说一个计算PI为一百万位数的XQuery程序,它将在您调用该进程的主机上运行,并且不会自动分发

这些都是极端情况。。。您的应用程序可能介于分布式处理和非分布式处理之间,这通常运行良好,但如果您发现一台主机正在执行大部分工作(如果您的应用程序主要是功能性处理而不是面向数据库的,则最常见),则有一些方法可以分散负载。例如,在web服务器上使用的相同技术也同样有效——在MarkLogic和您的请求之间使用负载平衡器和/或代理可以将请求路由到不同的主机进行处理。在内部,有一些方法可以手动安排特定主机上的处理。但一般来说,只有当您有一些特定的长时间运行的“批处理”类型的流程,并且希望对其进行特定的控制时,这才是有益的。如果您的应用程序是典型的“搜索、修改、处理”类型的应用程序,那么系统将很好地平衡这些内容


如果您想诊断或微调您的特定需求,您可以使用监控历史GUI详细查看发生了什么。通常,如果您发现负载分布不均匀,最简单也是最有益的更改是使用负载平衡器类似类型的代理应用程序。同样,如果您经常从静态内容提供相同的请求,缓存代理可以减轻一些工作。

谢谢您的回答。我非常高兴。翻译你的答案,需要时间去理解。请稍等正式答复。大致上,我理解你的回答。同时,我加深了对以下URL的理解。