<img src="//i.stack.imgur.com/RUiNP.png" height="16" width="18" alt="" class="sponsor tag img">elasticsearch Lucene/Solr搜索文档创建_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Search_Solr_Lucene

elasticsearch Lucene/Solr搜索文档创建

search solr lucene

elasticsearch Lucene/Solr搜索文档创建,elasticsearch,search,solr,lucene,elasticsearch,Search,Solr,Lucene,我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容每当创建一个新网页时，我是否每次都必须在lucene中创建一个带有字段的等效文档有没有lucene文档的屏幕截图/图像/图表一旦建立了反向索引，它是存储在DB中还是作为json 是否应根据我们的业务关键字手动制作自动更正词典以下分别是对您的问题的回答：当然可以；一旦你添加或创建了一个文档（这里是一个网页），你就应该建立索引，让它可以在你想要的时候尽快搜索 Lucene的文档是现实世界中的概念。因此，单个文档是指组成文档

我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容

每当创建一个新网页时，我是否每次都必须在lucene中创建一个带有字段的等效文档

有没有lucene文档的屏幕截图/图像/图表

一旦建立了反向索引，它是存储在DB中还是作为json

是否应根据我们的业务关键字手动制作自动更正词典

以下分别是对您的问题的回答：

当然可以；一旦你添加或创建了一个文档（这里是一个网页），你就应该建立索引，让它可以在你想要的时候尽快搜索

Lucene的文档是现实世界中的概念。因此，单个文档是指组成文档的一组字段（例如，网页是包含“标题”、“正文”、“标记”和“注释”的文档）。因此，为了使此文档可搜索，我们创建了一个lucene文档，并告诉lucene对其进行索引。如果您熟悉编程，Lucene documnet是一个带有一些字段的

类



当然可以，但不是存储在json中。有一组文件构成索引。从一个角度来看，它看起来像json（因为它存储在HDD上），但实际上不是json。它由以下格式组成（segments.gen、segments\u N、write.lock、.cfs、.fnm等，您可以使用这些格式进行签出）

您可以添加自己的字典校正器，同时使用默认的字典校正器
谢谢你的见解！我还有一个问题关于Lucene使用“反向索引”对吗？这意味着，它的索引不是page->word，而是word->page。1.但是在你上面分享的图片中，索引是如何反转的？2.此外，实际的搜索关键字是否在这些文档中？是的；正如你所说，Lucene使用反向索引。Lucene逻辑上使用反向索引。但在物理上实现为B+树（或哈希表）。因为术语的大小是巨大的，所以它不能作为一个典型的表来准备。它实现为其他数据结构，以提高速度和优化，并支持通配符查询（以及查询更正）。我可以让你参考这本书的索引构建章节：“克里斯托弗·曼宁的信息检索导论”。我建议你找到一些好的教程，并在Lucene网站上查看可用的资源。例如，这是有帮助的。否则，您的问题可能过于宽泛，无法解决堆栈溢出问题。写一些代码，如果你被卡住了，你可以问一个特定的问题。此外，你提到和-每个人都有一套很棒的“入门”文档，这与Lucene背后的许多概念非常相关。