Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/309.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 索尔卢德酒店;数据导入处理程序_Java_Solr_Apache Zookeeper_Solr4_Solrcloud - Fatal编程技术网

Java 索尔卢德酒店;数据导入处理程序

Java 索尔卢德酒店;数据导入处理程序,java,solr,apache-zookeeper,solr4,solrcloud,Java,Solr,Apache Zookeeper,Solr4,Solrcloud,我计划将Solr从单实例选项升级到云选项。目前我有5个内核,每个都配置了数据导入处理程序。我在tomcat文件夹中部署了web应用程序以及solr.war,它将根据我的项目需要定期触发完整导入和增量导入 现在,我计划为这个应用程序创建2个分片,将我5个核心数据的一半保存到每个分片中。我不明白DIH在SolrCloud中如何工作 如果我从两个碎片开始完全索引,可以吗 或者我只需要从一个碎片做完整的索引 架构如下所示 这完全取决于您如何创建solr云:使用复合id或隐式路由。使用复合id路由将负

我计划将Solr从单实例选项升级到云选项。目前我有5个内核,每个都配置了数据导入处理程序。我在tomcat文件夹中部署了web应用程序以及solr.war,它将根据我的项目需要定期触发完整导入和增量导入

现在,我计划为这个应用程序创建2个分片,将我5个核心数据的一半保存到每个分片中。我不明白DIH在SolrCloud中如何工作

  • 如果我从两个碎片开始完全索引,可以吗
  • 或者我只需要从一个碎片做完整的索引
架构如下所示

这完全取决于您如何创建solr云:使用复合id或隐式路由。使用复合id路由将负责将文档分散到所有可用碎片上。您可以从任何solr cloud节点启动导入。最终,云环境将包含分布在所有碎片上的导入文档索引。 如果使用隐式路由,则可以控制每个文档索引的存放位置。
您不必使用DIH。或者,您也可以编写一个小应用程序,使用solr客户端填充索引,从而提供更多控制。

这取决于您创建solr云的方式:使用复合id或隐式路由。使用复合id路由将负责将文档分散到所有可用碎片上。您可以从任何solr cloud节点启动导入。最终,云环境将包含分布在所有碎片上的导入文档索引。 如果使用隐式路由,则可以控制每个文档索引的存放位置。
您不必使用DIH。或者,您可以编写一个小应用程序,使用solr客户端填充索引,这给了您更多的控制权。

经过大量的搜索和阅读,我最终决定实现DIH,如下所示。请让我知道您的意见,如果您觉得这将是与此架构的问题


经过大量的谷歌搜索和阅读,我最终决定实施DIH,如下所示。请让我知道您的意见,如果您觉得这将是与此架构的问题


您能通过将5个核心数据分成两个碎片来阐明您的意思吗?你的意思是说你要根据某种条件将数据“路由”到任何一个碎片吗?这就是我的想法。但我不知道这是否可能实现。您能否建议是否有替代性?您能否通过将5个岩心数据分成两个碎片来澄清您的意思?你的意思是说你要根据某种条件将数据“路由”到任何一个碎片吗?这就是我的想法。但我不知道这是否可能实现。你能建议一下有没有替代品吗?谢谢你的回复。我没有离开DIH的自由。如果我从一台机器上启动DIH,那么我将遇到HA问题。如何确保即使我从一台机器上启动DIH,我也能实现HA?HA是什么意思?高可用性?你是说你想在有流量的时候导入数据吗?你需要提供更多的反馈。是的,你是对的。HA->高可用性。我希望导入与查询并行进行。这就是我在单个实例中所做的。让我总结一下:您想使用DIH将数据从数据源导入到solr cloud,而流量仍然流向源?还是去solr cloud?我说得对吗?对!你是对的。交通流到源&它必须通过增量导入流到solr cloud。谢谢你的回复。我没有离开DIH的自由。如果我从一台机器上启动DIH,那么我将遇到HA问题。如何确保即使我从一台机器上启动DIH,我也能实现HA?HA是什么意思?高可用性?你是说你想在有流量的时候导入数据吗?你需要提供更多的反馈。是的,你是对的。HA->高可用性。我希望导入与查询并行进行。这就是我在单个实例中所做的。让我总结一下:您想使用DIH将数据从数据源导入到solr cloud,而流量仍然流向源?还是去solr cloud?我说得对吗?对!你是对的。交通流到源&它必须通过增量导入流到solr cloud。