Search 最佳Solr JVM/虚拟/物理内存配置
我们公司有几种不同的获取潜在客户的方式,以及我们处理的几种类型的潜在客户。每种类型的潜在客户之间只有细微的差异,并且大部分信息与一种或多种其他潜在客户类型共享或相关。我和我的团队正在尝试使用Solr构建/配置一个索引,该索引处理这些潜在客户类型及其所有共享数据。。客户数据,度假村数据。etc(总共约120万条记录)。我们目前正在托管一台Ubuntu服务器(12GRAM,8核Opteron),运行Tomcat6和Solr3.4 我希望该索引能够在客户在我们的网站上提交lead gen表单时(大约每天1500-2000次)实时添加记录,并在员工添加或修改数据时(大约每天2500-3000次)进行更新 此外,我需要网站上的客户和内部员工能够快速搜索这些数据,包括过滤器、面、自动完成、突出显示和所有编写良好的搜索所需的内容 此设置当前正在运行,但经常挂起网站和内部应用程序中的更新记录。提交每1000个文档或5秒完成一次,我每天优化一次。对于这种类型的设置,最佳的JVM、服务器或Solr配置是什么?任何帮助都将不胜感激,我可以向任何愿意帮助的人提供所需的信息。首先 在Solr中配置JVM堆大小时,有两个常见错误:Search 最佳Solr JVM/虚拟/物理内存配置,search,ubuntu,solr,jvm,Search,Ubuntu,Solr,Jvm,我们公司有几种不同的获取潜在客户的方式,以及我们处理的几种类型的潜在客户。每种类型的潜在客户之间只有细微的差异,并且大部分信息与一种或多种其他潜在客户类型共享或相关。我和我的团队正在尝试使用Solr构建/配置一个索引,该索引处理这些潜在客户类型及其所有共享数据。。客户数据,度假村数据。etc(总共约120万条记录)。我们目前正在托管一台Ubuntu服务器(12GRAM,8核Opteron),运行Tomcat6和Solr3.4 我希望该索引能够在客户在我们的网站上提交lead gen表单时(大约每
- 给JVM提供太多内存(操作系统缓存将无法缓存磁盘操作)
- 没有给JVM足够的内存(垃圾收集器将面临很大的压力,它将被迫运行频繁的停止世界收集,使用JMX监视来确定是否触发了完整的GC)
mergeFactor
,就会触发合并。较低的mergeFactor
值可以解释挂起
您应该提供有关当前设置的更多详细信息,以便我们可以帮助您:
- JVM大小
- 您正在使用的采集器(G1、吞吐量采集器、并发低暂停采集器等)
- 索引大小(在磁盘上,而不是文档数)
,mergeFactor
ramBufferSizeMB
- 给JVM提供太多内存(操作系统缓存将无法缓存磁盘操作)
- 没有给JVM足够的内存(垃圾收集器将面临很大的压力,它将被迫运行频繁的停止世界收集,使用JMX监视来确定是否触发了完整的GC)
mergeFactor
,就会触发合并。较低的mergeFactor
值可以解释挂起
您应该提供有关当前设置的更多详细信息,以便我们可以帮助您:
- JVM大小
- 您正在使用的采集器(G1、吞吐量采集器、并发低暂停采集器等)
- 索引大小(在磁盘上,而不是文档数)
,mergeFactor
ramBufferSizeMB