复制只读solr服务器

复制只读solr服务器,solr,Solr,我创建了一个Solr1.4索引,并希望为大容量应用程序提供针对它的查询。我查询的索引是静态的——不允许再进行更新。两个客户端应用程序在服务器驱动器上发出请求,在一个四核ubuntu机箱上CPU负载达到大约200%,因此我考虑在第二个机箱上复制索引,并并行运行,以提高吞吐量 我关闭了solr,将索引复制到一个单独的目录,配置solr服务器以指向新的索引,并启动了这两个索引。虽然原始服务器与以前一样工作,但副本找不到任何文档 当我在服务器上列出目录列表时,我看到一些有点奇怪的东西: 这是原始索引目录

我创建了一个Solr1.4索引,并希望为大容量应用程序提供针对它的查询。我查询的索引是静态的——不允许再进行更新。两个客户端应用程序在服务器驱动器上发出请求,在一个四核ubuntu机箱上CPU负载达到大约200%,因此我考虑在第二个机箱上复制索引,并并行运行,以提高吞吐量

我关闭了solr,将索引复制到一个单独的目录,配置solr服务器以指向新的索引,并启动了这两个索引。虽然原始服务器与以前一样工作,但副本找不到任何文档

当我在服务器上列出目录列表时,我看到一些有点奇怪的东西: 这是原始索引目录的列表

total 3581328
-rw-r--r-- 1 gene pal 2502676419 2010-07-08 20:53 _38.fdt
-rw-r--r-- 1 gene pal     488660 2010-07-08 20:53 _38.fdx
-rw-r--r-- 1 gene pal        198 2010-07-08 20:53 _38.fnm
-rw-r--r-- 1 gene pal  213752776 2010-07-08 20:54 _38.frq
-rw-r--r-- 1 gene pal     366496 2010-07-08 20:54 _38.nrm
-rw-r--r-- 1 gene pal  725677119 2010-07-08 20:54 _38.prx
-rw-r--r-- 1 gene pal    1124453 2010-07-08 20:54 _38.tii
-rw-r--r-- 1 gene pal   85260530 2010-07-08 20:54 _38.tis
-rw-r--r-- 1 gene pal     280471 2010-07-08 20:54 _38.tvd
-rw-r--r-- 1 gene pal  133020745 2010-07-08 20:54 _38.tvf
-rw-r--r-- 1 gene pal     977316 2010-07-08 20:54 _38.tvx
-rw-r--r-- 1 gene pal        299 2010-07-08 20:54 segments_1b
-rw-r--r-- 1 gene pal         20 2010-07-08 20:54 segments.gen
INFO: Opening new SolrCore at solr/, dataDir=./data/
以下是副本列表:

total 3577796
-rw-r--r-- 1 gene pal 2502676419 2010-07-10 23:16 _38.fdt
-rw-r--r-- 1 gene pal     488660 2010-07-10 23:15 _38.fdx
-rw-r--r-- 1 gene pal        198 2010-07-10 23:15 _38.fnm
-rw-r--r-- 1 gene pal  213752776 2010-07-10 23:15 _38.frq
-rw-r--r-- 1 gene pal     366496 2010-07-10 23:15 _38.nrm
-rw-r--r-- 1 gene pal  725677119 2010-07-10 23:16 _38.prx
-rw-r--r-- 1 gene pal    1124453 2010-07-10 23:16 _38.tii
-rw-r--r-- 1 gene pal   85260530 2010-07-10 23:15 _38.tis
-rw-r--r-- 1 gene pal     280471 2010-07-10 23:16 _38.tvd
-rw-r--r-- 1 gene pal  133020745 2010-07-10 23:16 _38.tvf
-rw-r--r-- 1 gene pal     977316 2010-07-10 23:16 _38.tvx
-rw-r--r-- 1 gene pal        299 2010-07-10 23:15 segments_1b
-rw-r--r-- 1 gene pal         20 2010-07-10 23:15 segments.gen
虽然文件大小看起来都一样,但每个列表顶部显示的总大小是不同的。即使solr启动消息表明它正在查看此目录

total 3581328
-rw-r--r-- 1 gene pal 2502676419 2010-07-08 20:53 _38.fdt
-rw-r--r-- 1 gene pal     488660 2010-07-08 20:53 _38.fdx
-rw-r--r-- 1 gene pal        198 2010-07-08 20:53 _38.fnm
-rw-r--r-- 1 gene pal  213752776 2010-07-08 20:54 _38.frq
-rw-r--r-- 1 gene pal     366496 2010-07-08 20:54 _38.nrm
-rw-r--r-- 1 gene pal  725677119 2010-07-08 20:54 _38.prx
-rw-r--r-- 1 gene pal    1124453 2010-07-08 20:54 _38.tii
-rw-r--r-- 1 gene pal   85260530 2010-07-08 20:54 _38.tis
-rw-r--r-- 1 gene pal     280471 2010-07-08 20:54 _38.tvd
-rw-r--r-- 1 gene pal  133020745 2010-07-08 20:54 _38.tvf
-rw-r--r-- 1 gene pal     977316 2010-07-08 20:54 _38.tvx
-rw-r--r-- 1 gene pal        299 2010-07-08 20:54 segments_1b
-rw-r--r-- 1 gene pal         20 2010-07-08 20:54 segments.gen
INFO: Opening new SolrCore at solr/, dataDir=./data/
管理员统计显示solr没有可用的文档

我还应该看什么来解决这个问题

谢谢

Gene

(在创建stackoverflow帐户之前,我发布了原始问题,但不知道如何编辑原始问题;因此,我发布了第二篇帖子,而不是编辑或评论;很抱歉造成混淆。)


是的,我复制了整个solr目录,然后编辑solrconfig.xml以指向第二个索引位置。启动时,两个solr实例都报告了正确的dataDir位置。

我发现它比在文件系统上复制索引文件更容易使用

在从机上创建一个新的空内核。然后使用
fetchindex
命令指示该内核从现有主机进行复制。Solr将为您处理所有其余的重物

例如,您将得到如下URL:


http://slave_host:port/solr/corename/replication?command=fetchindex&masterUrl=http://master_host:port/solr/corename/replication

是否也复制了solrconfig.xml和schema.xml?日志中没有任何错误?没有隐藏的文件,对吗?(即尝试ls-a)结果证明这是我的愚蠢(这一直是操作假设):我将solrconfig.xml文件中的索引位置指定为./data,而不是./solr/data,因为我从上面的注释中复制了它。这看起来不错,我已经发现我需要在solrconfig.xml中在这两个,包括在提交后告诉主机复制器。然而,我在让从机有一个更老的“版本”以便它实际获取索引方面遇到了困难,因为它是在主机之后旋转的,并且它的时间戳是较新的。新的主控提交似乎只会影响其版本号中的“毫秒”数字。有什么建议吗?(Solr 1.4)好的,我的窍门是将主XML放在从属XML中,而不是指定为URL参数,然后只使用command=fetchindex。谢谢