Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
<img src="//i.stack.imgur.com/RUiNP.png" height="16" width="18" alt="" class="sponsor tag img">elasticsearch Lucene/Solr搜索文档创建_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Search_Solr_Lucene - Fatal编程技术网 elasticsearch Lucene/Solr搜索文档创建,elasticsearch,search,solr,lucene,elasticsearch,Search,Solr,Lucene" /> elasticsearch Lucene/Solr搜索文档创建,elasticsearch,search,solr,lucene,elasticsearch,Search,Solr,Lucene" />

elasticsearch Lucene/Solr搜索文档创建

elasticsearch Lucene/Solr搜索文档创建,elasticsearch,search,solr,lucene,elasticsearch,Search,Solr,Lucene,我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容 每当创建一个新网页时,我是否每次都必须在lucene中创建一个带有字段的等效文档 有没有lucene文档的屏幕截图/图像/图表 一旦建立了反向索引,它是存储在DB中还是作为json 是否应根据我们的业务关键字手动制作自动更正词典 以下分别是对您的问题的回答: 当然可以;一旦你添加或创建了一个文档(这里是一个网页),你就应该建立索引,让它可以在你想要的时候尽快搜索 Lucene的文档是现实世界中的概念。因此,单个文档是指组成文档

我正在使用Lucene在网站上构建搜索功能。我想更清楚地了解以下内容

  • 每当创建一个新网页时,我是否每次都必须在lucene中创建一个带有字段的等效文档
  • 有没有lucene文档的屏幕截图/图像/图表
  • 一旦建立了反向索引,它是存储在DB中还是作为json
  • 是否应根据我们的业务关键字手动制作自动更正词典

  • 以下分别是对您的问题的回答:

  • 当然可以;一旦你添加或创建了一个文档(这里是一个网页),你就应该建立索引,让它可以在你想要的时候尽快搜索
  • Lucene的文档是现实世界中的概念。因此,单个文档是指组成文档的一组字段(例如,网页是包含“标题”、“正文”、“标记”和“注释”的文档)。因此,为了使此文档可搜索,我们创建了一个lucene文档,并告诉lucene对其进行索引。如果您熟悉编程,Lucene documnet是一个带有一些字段的
  • 当然可以,但不是存储在json中。有一组文件构成索引。从一个角度来看,它看起来像json(因为它存储在HDD上),但实际上不是json。它由以下格式组成(segments.gen、segments\u N、write.lock、.cfs、.fnm等,您可以使用这些格式进行签出)
  • 您可以添加自己的字典校正器,同时使用默认的字典校正器

  • 谢谢你的见解!我还有一个问题关于Lucene使用“反向索引”对吗?这意味着,它的索引不是page->word,而是word->page。1.但是在你上面分享的图片中,索引是如何反转的?2.此外,实际的搜索关键字是否在这些文档中?是的;正如你所说,Lucene使用反向索引。Lucene逻辑上使用反向索引。但在物理上实现为B+树(或哈希表)。因为术语的大小是巨大的,所以它不能作为一个典型的表来准备。它实现为其他数据结构,以提高速度和优化,并支持通配符查询(以及查询更正)。我可以让你参考这本书的索引构建章节:“克里斯托弗·曼宁的信息检索导论”。我建议你找到一些好的教程,并在Lucene网站上查看可用的资源。例如,这是有帮助的。否则,您的问题可能过于宽泛,无法解决堆栈溢出问题。写一些代码,如果你被卡住了,你可以问一个特定的问题。此外,你提到和-每个人都有一套很棒的“入门”文档,这与Lucene背后的许多概念非常相关。