Amazon ec2 建议使用dev、prod或本地环境变量设置MarkLogic 8?

Amazon ec2 建议使用dev、prod或本地环境变量设置MarkLogic 8?,amazon-ec2,marklogic,marklogic-8,roxy,Amazon Ec2,Marklogic,Marklogic 8,Roxy,默认情况下,有三个环境变量可以使用MarkLogic的ruby roxy配置运行(roxy脚本在这里:)。这三个变量是:local、dev和prod。但是,可以添加其他环境变量 对于local、dev和prod服务器,最好的设置是什么?prod服务器位于ec2 AWS上 我认为,在本地,应该只有1或2个林,在一台服务器上,4个核心可能有1或2个林。森林可以并行运行。我认为在开发环境中,应该运行测试。另外,我想知道MarkLogic DB在本地和ec2实例上运行时缓存了多少空间 我相信,默认情况下

默认情况下,有三个环境变量可以使用MarkLogic的ruby roxy配置运行(roxy脚本在这里:)。这三个变量是:
local
dev
prod
。但是,可以添加其他环境变量

对于
local
dev
prod
服务器,最好的设置是什么?prod服务器位于ec2 AWS上

我认为,在本地,应该只有1或2个林,在一台服务器上,4个核心可能有1或2个林。森林可以并行运行。我认为在开发环境中,应该运行测试。另外,我想知道MarkLogic DB在本地和ec2实例上运行时缓存了多少空间

我相信,默认情况下prod环境变量确实运行test(尽管这可能是错误的)

一些信息:


正如Dave所提到的,最佳设置取决于许多因素,但我要补充的是,nr forests主要取决于您希望加载的数据量,以及您寻求的响应时间和加载速度。使用相同数量的数据,更多的林将允许查询和摄取的更多并行化。一旦cpu、mem或磁盘速度达到极限,就可以水平扩展以允许额外的林

关于local与dev和prod的比较,这实际上取决于您希望加载多少数据,以及系统本身的限制。我通常从每台主机3个林开始(Roxy的默认设置),即使是本地的

是的,就像戴夫说的,我鼓励阅读。它发展得相当深入,最近进行了更新,加入了最新的功能


最佳设置取决于许多变量,包括数据集的大小和内容,以及您想对其执行的操作。根据你到目前为止所说的,我将从默认设置开始,并从那里开始播放。谢谢Dave,我喜欢看你的youtube视频。他们很有帮助。您是否能够指出如何为不同的内容定制MarkLogic设置的正确方向,特别是在语义方面?我还没有找到关于数据库内容的好资源。我希望得到一些“经验法则”的测量,但你是对的,有很多变量,所以很难给出明确的答案。如果你还没有,我建议你阅读。这将使您更好地了解内部工作,从而更好地了解如何调整索引。(请注意,该论文的当前版本是为ML7编写的;更新版本正在准备中。)我的另一个建议是更具体的问题——告诉我们您的数据(如果可能,请提供样本)以及您希望如何使用它。如果您的数据是可供使用和学习的样本数据,那没关系。我有一个用于啤酒配方的MarkLogic应用程序——对于探索仍然很有用。