Database 将SolrCloud与RDBMS结合使用或将Solr用作主数据存储

Database 将SolrCloud与RDBMS结合使用或将Solr用作主数据存储,database,hadoop,solr,solrcloud,Database,Hadoop,Solr,Solrcloud,我想知道哪种场景(或组合)更适合我的应用程序。从性能、可扩展性和高可用性方面来看 这是我的申请表: 假设我有超过1000万个文档,而且每天都在增长。(可能在1年内,它将达到1亿多个文档。我想使用Solr作为索引这些文档的工具,但问题是我有一些数据字段可能会经常更改。(不会太多,但可能会更改) 场景: 1-使用SolrCloud作为所有数据的数据库。(即使是可以更改的数据) 2-使用SolrCloud作为静态数据的数据库,使用RDBMS(如oracle)存储动态字段 3-对所有数据使用SolrCl

我想知道哪种场景(或组合)更适合我的应用程序。从性能、可扩展性和高可用性方面来看

这是我的申请表:

假设我有超过1000万个文档,而且每天都在增长。(可能在1年内,它将达到1亿多个文档。我想使用Solr作为索引这些文档的工具,但问题是我有一些数据字段可能会经常更改。(不会太多,但可能会更改)

场景:

1-使用SolrCloud作为所有数据的数据库。(即使是可以更改的数据)

2-使用SolrCloud作为静态数据的数据库,使用RDBMS(如oracle)存储动态字段

3-对所有数据使用SolrCloud和Hadoop(HDFS+MapReduce)的集成


致以最诚挚的问候。

我不确定SolrCloud如何与DIH一起工作(您可能会遇到这样的情况,即索引只在一个实例上发生)

另一方面,我会将数据存储在RDBMS中,因为您有时需要重新编制Solr的索引,以便向索引中添加一些新功能


在一天结束时,我会将DB+Solr(所有字段)与Hadoop一起使用(尚未使用)或者使用其他软件将数据发布到SolrCloud。

如果我需要搜索已存储在RDBMS中的动态字段,该怎么办?如果我不需要对动态字段进行任何索引,则此解决方案会起作用。对吗?我建议也对这些动态字段进行索引。有一段时间我在系统中工作,其中一些字段只有nDB,这在a*中有点痛苦。在Solr中,有一些方法可以让这些字段为您工作:)我需要知道更多关于这个主题的建议。