elasticsearch,Lucene,elasticsearch" /> elasticsearch,Lucene,elasticsearch" />

Lucene 不保存数据的弹性搜索引擎

Lucene 不保存数据的弹性搜索引擎,lucene,elasticsearch,Lucene,elasticsearch,Elastic/Lucene真的需要在文档中存储所有索引数据吗?难道你不能通过传递数据让每个文档都有一个单独的字段,其中包含返回每个文档来源的URL(或者任何对你有意义的指针) 一个简单的例子可能是为维基百科.org编制索引。如果我将每个网页传递给Elastic/Lucene进行索引-如果Lucene对每个网页进行索引,并且有一个相应的URL字段用于回复搜索,为什么我需要将每个网页的主文本保存在一个字段中 我们向云支付了这么多钱来存储这么多冗余数据——我只是想知道为什么Lucene是从它的哈希表

Elastic/Lucene真的需要在文档中存储所有索引数据吗?难道你不能通过传递数据让每个文档都有一个单独的字段,其中包含返回每个文档来源的URL(或者任何对你有意义的指针)

一个简单的例子可能是为维基百科.org编制索引。如果我将每个网页传递给Elastic/Lucene进行索引-如果Lucene对每个网页进行索引,并且有一个相应的URL字段用于回复搜索,为什么我需要将每个网页的主文本保存在一个字段中

我们向云支付了这么多钱来存储这么多冗余数据——我只是想知道为什么Lucene是从它的哈希表而不是我们保存数据到的实际字段中进行搜索。。。如果我们不需要,为什么要保存这些数据


有没有一种方法可以在弹性中索引全文文档,而不必保存这些文档中的所有全文数据?

源字段有很多选项。这是实际存储原始文档的字段。您可以完全禁用它或决定保留哪些字段。更多信息可在文档中找到: