Indexing Solr使用什么技术来索引文件?

Indexing Solr使用什么技术来索引文件?,indexing,solr,lucene,search-engine,Indexing,Solr,Lucene,Search Engine,正如您所知,有不同的技术为搜索引擎索引文档。 如倒排索引、分布式动态索引、语义索引、NGram索引、上下文索引、大数据、多语言索引等。 我现在和索尔一起工作。我想知道Solr使用哪些技术来索引文档,以及Solr(或Lucene)如何使用这些技术?首先,这是一个非常广泛的领域,您列出的大多数术语都不是索引类型。它们描述了可以支持的产品功能(或流行语),而不管索引是如何在幕后构建的 Solr使用Lucene,其核心是一个反向索引 该索引存储有关术语的统计信息,以便使基于术语的搜索更有效。Lucene

正如您所知,有不同的技术为搜索引擎索引文档。 如倒排索引、分布式动态索引、语义索引、NGram索引、上下文索引、大数据、多语言索引等。
我现在和索尔一起工作。我想知道Solr使用哪些技术来索引文档,以及Solr(或Lucene)如何使用这些技术?

首先,这是一个非常广泛的领域,您列出的大多数术语都不是索引类型。它们描述了可以支持的产品功能(或流行语),而不管索引是如何在幕后构建的

Solr使用Lucene,其核心是一个反向索引

该索引存储有关术语的统计信息,以便使基于术语的搜索更有效。Lucene的索引属于被称为反向索引的索引系列。这是因为它可以为一个术语列出包含它的文档。这与文档列出术语的自然关系相反

还有许多支持结构可以使Lucene在某些查询和功能方面更加高效。在这种特性上,可以将其描述为一个面向列的存储,它具有文档->术语映射,以加快刻面处理等操作


您可以在中看到这些支持功能的大部分。由于这是一个相当大的列表,我将从注释本身中删除它。

首先-这是一个非常广泛的领域,您列出的大多数术语都不是索引类型。它们描述了可以支持的产品功能(或流行语),而不管索引是如何在幕后构建的

Solr使用Lucene,其核心是一个反向索引

该索引存储有关术语的统计信息,以便使基于术语的搜索更有效。Lucene的索引属于被称为反向索引的索引系列。这是因为它可以为一个术语列出包含它的文档。这与文档列出术语的自然关系相反

还有许多支持结构可以使Lucene在某些查询和功能方面更加高效。在这种特性上,可以将其描述为一个面向列的存储,它具有文档->术语映射,以加快刻面处理等操作


您可以在中看到这些支持功能的大部分。由于这是一个相当大的列表,我将把它从评论本身中删除。

要回答哪些技术-在引擎盖下,Solr使用LuceneAPI,而Lucene索引技术是-反向索引。Solr只是一个带有基础设施包装器的完整应用程序,但底层文档索引技术是由Lucene API提供的

Solr(或Lucene)如何使用这些技术?

这是一个很好的概述Lucene索引初学者。这只是一个非常简单的概述,但解释了基本原理

由于Solr是一个产品,它的大多数可用文档都是功能文档(不解释实际的索引技术等),而且由于Lucene的原始使用量很少,Lucene文档没有达到标准,因此大多数时候,需要挖掘Lucene代码或API文档来理解Lucene的工作


希望能有帮助

要回答哪些技术-在引擎盖下,Solr使用LuceneAPI,Lucene索引技术是-反向索引。Solr只是一个带有基础设施包装器的完整应用程序,但底层文档索引技术是由Lucene API提供的

Solr(或Lucene)如何使用这些技术?

这是一个很好的概述Lucene索引初学者。这只是一个非常简单的概述,但解释了基本原理

由于Solr是一个产品,它的大多数可用文档都是功能文档(不解释实际的索引技术等),而且由于Lucene的原始使用量很少,Lucene文档没有达到标准,因此大多数时候,需要挖掘Lucene代码或API文档来理解Lucene的工作

希望能有帮助