elasticsearch Lucene/Solr搜索文档创建
我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容
elasticsearch Lucene/Solr搜索文档创建,
elasticsearch,search,solr,lucene,
elasticsearch,Search,Solr,Lucene,我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容 每当创建一个新网页时,我是否每次都必须在lucene中创建一个带有字段的等效文档 有没有lucene文档的屏幕截图/图像/图表 一旦建立了反向索引,它是存储在DB中还是作为json 是否应根据我们的业务关键字手动制作自动更正词典 以下分别是对您的问题的回答: 当然可以;一旦你添加或创建了一个文档(这里是一个网页),你就应该建立索引,让它可以在你想要的时候尽快搜索 Lucene的文档是现实世界中的概念。因此,单个文档是指组成文档
以下分别是对您的问题的回答:
类
谢谢你的见解!我还有一个问题关于Lucene使用“反向索引”对吗?这意味着,它的索引不是page->word,而是word->page。1.但是在你上面分享的图片中,索引是如何反转的?2.此外,实际的搜索关键字是否在这些文档中?是的;正如你所说,Lucene使用反向索引。Lucene逻辑上使用反向索引。但在物理上实现为B+树(或哈希表)。因为术语的大小是巨大的,所以它不能作为一个典型的表来准备。它实现为其他数据结构,以提高速度和优化,并支持通配符查询(以及查询更正)。我可以让你参考这本书的索引构建章节:“克里斯托弗·曼宁的信息检索导论”。我建议你找到一些好的教程,并在Lucene网站上查看可用的资源。例如,这是有帮助的。否则,您的问题可能过于宽泛,无法解决堆栈溢出问题。写一些代码,如果你被卡住了,你可以问一个特定的问题。此外,你提到和-每个人都有一套很棒的“入门”文档,这与Lucene背后的许多概念非常相关。