elasticsearch,Optimization,Indexing,elasticsearch" /> elasticsearch,Optimization,Indexing,elasticsearch" />

Optimization 使用Elasticsearch进行大量不间断索引时,我应该采用哪种优化策略?

Optimization 使用Elasticsearch进行大量不间断索引时,我应该采用哪种优化策略?,optimization,indexing,elasticsearch,Optimization,Indexing,elasticsearch,我有一个搜索引擎应用程序,可以不断解析提要,并在ES(版本1.5.2)中为结果编制索引 我平均有350万个文档被索引。 删除文档的百分比有时约为40%,我在索引(批量)时有一些请求超时 我应该采取哪种优化策略 我是否应该每天停止一次或多次索引以 优化索引并减少已删除文档和 合并片段 优化过程是否会影响查询 我想知道对于这个用例,哪一个是最好的解决方案 我使用的是一个自定义id,我知道它有性能问题,但它不是一个可悲的改变它的选项 如果您的一些批量索引请求超时,这表明您需要降低索引率,请提前感谢

我有一个搜索引擎应用程序,可以不断解析提要,并在ES(版本1.5.2)中为结果编制索引

我平均有350万个文档被索引。 删除文档的百分比有时约为40%,我在索引(批量)时有一些请求超时

  • 我应该采取哪种优化策略

  • 我是否应该每天停止一次或多次索引以
    优化索引并减少已删除文档和 合并片段

  • 优化过程是否会影响查询
我想知道对于这个用例,哪一个是最好的解决方案

我使用的是一个自定义id,我知道它有性能问题,但它不是一个可悲的改变它的选项


如果您的一些批量索引请求超时,这表明您需要降低索引率,请提前感谢。Elasticsearch专家建议不要使用优化API。在后台,发生了段合并,它负责自动删除已删除的文档。如果索引率很高,也不要使用优化API。这只会导致更多索引请求超时。是的,优化也会对搜索性能产生负面影响,因为它是一项资源密集型操作

简而言之,只需降低索引率。这将解决你在这里提到的大部分问题。请求不会超时,已删除文档的百分比也可能下降