Lucene_IT技术博客_编程技术问答 - 「Fatal编程技术网」

Lucene 所有这些词都有自己的特点

标签： Lucene

我有一个在Lucene中索引的“描述”字段。这个字段包含一本书的描述。如何使用BooleanQuery类在该字段上实现“所有这些单词”功能？例如，如果用户键入“畅销书”，则应返回描述中包含所有这些单词的书籍谢谢我相信如果您通过并将第二个参数设置为常量booleansclause.occurrent.MUST，那么您应该得到您想要的。等效的查询语法是“+term1+term2+term3…”。有两个部分可以实现这一点：您需要对传入的文档进行适当的分析，以便对单个单词分别进行标记和索引

在Lucene中将来自多个文档的点击组合成单个点击

标签： Lucene lucene.net

我试图让一个特定的搜索工作，它被证明是有问题的。实际的源数据相当复杂，但可以通过以下示例进行总结：我有一些文章被编入索引，所以他们可以被搜查。每个文章还具有多个属性与之相关的索引和搜索。当用户搜索，他们可以在任何一个主要文章或相关文章财产。不管打到哪里实现后，返回文章作为搜索结果（即属性他们自己永远不会成功）现在谈谈复杂性：每个财产都有担保，这意味着对于任何给定的用户，他们可能看不到，也可能看不到财产。如果用户无法看到财产，他们显然得不到搜索成功了。这是安全检

Lucene ApacheSolr:由group by生成的数据总和

标签： Lucene Solr

我们有一个要求，我们需要按特定字段对记录进行分组，并取相应数字字段的总和 e、 x.按用户ID从用户操作组中选择用户ID、总和（单击计数）我们正在尝试使用apache solr实现这一点，并发现有两种实现方法：正在使用字段折叠功能（），但发现了以下两个问题： 1.1. 这不是发行版的一部分，可以作为补丁提供，所以我们不确定是否可以在生产中使用它。 1.2. 我们不收回总额，而是单独计算，我们需要在客户端进行汇总使用Stats组件和facetedsearch（）。这满足了我们的要求，但对于非

Lucene 标记可以经常更改的标记文档的索引策略

标签： Lucene lucene.net

除了文本内容之外，我的文档还有可以搜索的标签。现在的问题是，标记经常更改，每次添加或删除标记时，我都必须调用UpdateDocument，这对于数百个文档来说是非常缓慢的对于经常更改并需要使用Lucene搜索的标签，是否有性能良好的存储策略？我一直在考虑将标记保存在单独的文档中，以使它们更小，但我不知道如何快速搜索标记和内容。将[tag，UID]对存储在关系数据库中。每次添加或更新标记时，都会在数据库的该表中添加和更新该标记当执行包含标记数据（存储在数据库中）和内容（在Lucene中编制索引

如何在Solrnet/Solr（Lucene）中实现分组？

标签： Lucene Solr lucene.netsolrnet

我有根据PageID（UniqueKey）索引的Lucene文件。一个文档可以有多个页面。现在，一旦用户执行一些搜索，它就会给我们提供匹配搜索条件的页面我正在使用Lucene.NET2.9.2 我们有两个问题 1-文件大小约为800GB，有1.3亿行（页），因此搜索速度非常慢（所有查询都需要一分钟以上的时间（我们一次只需返回有限的行）为了克服性能问题，我转向SOLR，它解决了性能问题（这很奇怪，因为我没有使用SOLR提供的任何额外功能，如切分等-所以可能是Lucene.NET 2.9.2与J

如何从Lucene 3.0.3获得可靠的docid？

标签： Lucene

我想获取刚刚添加到Lucene索引中的文档的int docid，这样我就可以将其粘贴到过滤器中以更新一个长期查询。我的文档具有唯一的外部id，因此我认为对唯一id执行TermDocs枚举将返回正确的文档，如下所示： protected int getDocId(IndexReader reader, String idField, Document doc) throws IOException { String id = doc.get(idField); TermDocs t

Lucene 你如何标记这些花？

标签： Lucene Solr

我有一块价值1800英镑的田地。当我对它进行索引时，我希望将它标记为1800朵、1800朵、1800朵，然后最终n-grammed。目前，我已经编写了自己的filterfactory来完成这项工作。然而，我想知道Solr是否可以用现有的标记器和过滤器来实现这一点。任何人对此有更好的解决方案吗？您可以尝试使用。模式标记器可能会帮助我从1800Flowers中获得1800和Flowers，但我希望保留原始术语。您可以使用不同的标记器添加copyfield

Lucene 按solr中多值字段的特定值排序

标签： Lucene Solr

我有一个Solr索引，它在每个文档的多值字段中存储日期我需要有能力搜索一个日期范围（做到这一点），但也排序结果集的日期，其中日期是多值字段的第一个日期，属于范围内如果我尝试使用一个函数进行排序，它会告诉我它不能在多值字段上使用字段Caceh 有没有可能让一个函数在查询中填充一个字段，然后按该字段排序，或者使用另一个选项，或者唯一的选项是使用联接、按联接排序，然后字段折叠由于搜索的复杂性和连接的数量，我真的不能使用SQL，所以我希望有一种方法可以完成这项工作，而不会回到类似SQL的范例。您可

在lucene中搜索日期可用性的最佳方法

标签： Lucene date-range

我有一个场景，其中我有一个对象，该对象与可用性属性关联。我将一个月内的日期编码为32位二进制，1表示可用，0表示不可用。现在我想搜索在一定日期范围内可用的对象。我怎样才能最好地与lucene合作也许更好的存储方式是： available_on=20111028 available_on=20111029 其中，日期编码为整数，每个可用日期对应一个字段。然后可以使用NumericRangeQuery搜索可用性范围如果做不到这一点，我想您可以编写一个过滤器，逐级检查用于位字段的每个值，然后选择

尝试从命令行运行lucene应用程序时，未找到类定义错误

标签： Lucene runtime-errorclassnotfound

我是lucene的初学者，我曾尝试运行网站上给出的示例应用程序（helloluce.java）。代码已成功编译，并为应用程序创建了一个类文件（helloluce.class）但在尝试运行应用程序时，出现以下错误无法找到或加载主类HelloUser 我参考了链接并尝试了提供的解决方案，但都是徒劳的。请帮我解决这个问题我用来运行代码的命令是爪哇岛我尝试运行的代码： import org.apache.lucene.analysis.standard.StandardAnalyzer

Lucene 如何触发alfresco存储库的重新索引？

标签： Lucene Alfresco alfresco-share

每当我对某个人的location属性执行lucene搜索查询时，我都会得到一个小于预期的人列表。但是，我注意到，如果我创建了新的人员，他们会被包括在列表中，但是已经存在的用户（从备份恢复的回购数据）更改和更新位置时，他们不会被包括在集合中。因此，我怀疑需要对存储库重新编制索引。这取决于您使用的是旧的事务内Lucene索引，还是新的SOLR索引如果您使用的是SOLR，步骤如下。基本上，停止托管SOLR的Tomcat，删除索引目录和模型目录，然后重新启动它。SOLR然后将对索引进行干净的重建。如果

基于特定字段的过滤lucene搜索

标签： Lucene

我想返回在具有特定值的文档之后找到的所有匹配文档。该值是唯一的。我尝试过使用数字过滤。这不是一个好的解决方案，因为字段值可能是任意顺序的如果我了解您的需要，使用数字范围是获取所需内容的正确方法。为了在同一字段上排序，您需要向搜索调用传递一个参数，类似于： Sort sort = new Sort(new SortField("myNumericField", SortField.Type.INT)); searcher.search(query, maxDocs, sort) 在搜索中遇到某

Lucene索引搜索通配符不匹配

标签： Lucene wildcard

我有一个索引，我正在使用Luke测试一些查询。有一个案例让我感到困惑在索引中，我有以下名称：走走！克鲁格走！纳米比亚高尔夫球手当我将SimpleAnalyzer与以下查询名称一起使用时：go我得到了预期的结果，go！在列表的顶部。但是，当我在查询中使用通配符时，Name:go*我得到的结果除了go！或其任何衍生物。Golfer仅在运行通配符查询时返回我的理解是，星号通配符*的功能是零个或多个匹配项，还是我的理解不正确感叹号似乎不算作索引中的字符。我知道这是一个保留的查询字符我是

胡萝卜2 3.8.1未读取lucene 4.6.0指数

标签： Lucene carrot2

当尝试在lucene索引上使用集群时，我得到以下错误：处理错误：org.apache.lucene.index.indexformattooneweexception:不支持格式版本（资源：ChecksumIndexInput（SimpleFSIndexInput（path=“M:\files\projects\LombardiNetworks\lucene\index\segments\u 1”））：1（需要>介于0和0之间） org.apache.lucene.index.indexfor

在C#NEST中选择Lucene/Elastic搜索荧光灯

标签： Lucene elasticsearchhighlighting Nest

我还没有找到这个属性在C#NEST中的位置或是否公开。例如，在弹性搜索中，您可以指定普通荧光灯，如下所示： { "size": 500, "query": { "query_string": { "query": "\"C S M\"", "fields": [ "contentsStem" ], "default_operator": "and" } }, "highlight": { "

带通配符的Lucene短语查询

标签： Lucene query-performancephrase

我提出了一个解决方案，使用以下代码以编程方式创建查询来搜索带有通配符的短语： public static Query createPhraseQuery(String[] phraseWords, String field) { SpanQuery[] queryParts = new SpanQuery[phraseWords.length]; for (int i = 0; i < phraseWords.length; i++) { WildcardQ

elasticsearch 有没有一种方法可以在搜索查询中表示；省略字段的长度“；在弹性搜索？

标签：elasticsearch Lucene

省略字段长度的唯一解决方案是放置/更改文档的映射，并重新索引我不想要的整个数据有没有办法在查询时忽略字段的长度？如果长度筛选是由分析器内的执行的，则筛选出的术语将不会出现在反向索引中因此，您将无法使用查询搜索缺少的术语-您需要更新分析器并重新编制索引

elasticsearch Elasticsearch中的MLT查询是否使用术语向量？

标签：elasticsearch Lucene

如果这些ar激活，在Elasticsearch中是否使用术语向量？是底层Lucene MLT实现还提供了在术语向量不可用时对性能的一些控制

elasticsearch 在弹性搜索中访问Lucene查询'；s本机脚本记分器

标签：elasticsearch Lucene

我想编写一个自定义的弹性搜索计分器，它从索引中的文档中获取所有术语，从查询中获取所有术语，并基于一些自定义逻辑计算分数经过一些研究，在Java中实现弹性搜索中的自定义记分器最直接的方法似乎是使用其“本机脚本”功能（即实现AbstractDoubleSearchScript）。我遇到的问题是，我找不到在这样的脚本中访问原始查询对象的方法。我只能访问匹配的文档及其字段。是否有某种方法可以访问用于搜索的查询对象或者，使用我自己的（复杂的）算法（需要知道查询和文档的完整术语列表）对每个结果运行自定义

elasticsearch 按日期字段中的时间范围获取对象elasticsearch

标签：elasticsearch Lucene

elasticsearch中的文档映射中有一个日期字段，名为ConversationsPostDate "conversationSMPostDate": { "format": "yyyy-MM-dd HH:mm:ss", "type": "date" } 我想在从午夜到上午9点的时间范围内获得一些数据统计数据我尝试使用过滤器组合多个通配符，但没有成功。我搜索了一下，找不到一个方法来做这个。我想做一些类似的事情您好，我不确定这在elasticsearch中如何实现，但使用lucene

使用Lucene.Net的多个应用程序实例

标签： Lucene lucene.net

我正在开发一个WPF应用程序，它使用Lucene.Net对第三方进程生成的文件中的数据进行索引。它的容量很小，每分钟只创建一次新文件我的应用程序使用启动时创建的singletonIndexWriter实例。类似地，启动时也会创建indexsearch，但每当发生IndexWriter.Commit（）时会重新创建，以确保新添加的文档将出现在搜索结果中无论如何，有些用户需要运行应用程序的两个实例，但问题是，在第二个实例中搜索时，新添加的文档不会显示。我猜这是因为第一个实例正在进行提交，需要有一

elasticsearch Elasticsearch查询时间提升导致结果顺序不正确

标签：elasticsearch Lucene

在对每个关键字应用boost功能后，给定搜索关键字一二三的ES搜索结果似乎是错误的。请帮助我修改我的“错误”查询，以实现下面我描述的“预期结果”。我和LUCENE在ES1.7.4上4.10.4 提升标准-三个被视为最重要的关键词： ES索引内容-只显示MySQL转储，以缩短文章预期ES查询结果-用户正在搜索一二三。我不担心分数相等的记录的顺序。我的意思是如果记录6和13切换位置，我不介意 ES查询 curl -XPOST "http://127.0.0.1:9200/_search?post_

elasticsearch 弹性搜索中整数类型优于字符串字段类型

标签：elasticsearch Lucene

我想知道与字符串类型相比，除了整型字段类型的类型验证之外，还有什么其他优势。据我所知，在Lucene索引中，这些字段无论如何都是以公共字节格式存储的我问这个问题的原因是我有一个字段值，它可以是字符串也可以是整数。我在考虑是否应该在映射中创建不同的类型，即localhost:9200/index/string_type和localhost:9200/index/integer_type，或者我可以安全地（在性能和其他方面）为这两个变体使用字符串类型我使用的是elastic 2.4。实际上，您可

可以在特定的Lucene文档中找到常用词吗？例如：

标签： Lucene

结果：{{“doc1”、“doc2”、“doc3”}、{“苹果”、“iPhone”}或类似的东西其他问题：是否有更好的库/系统使用Lucene的数据来实现此目的？是的，您可以使用术语向量来检索此信息首先，您需要确保术语向量存储在索引中，例如： private static Document createDocument(String title, String content) { Document doc = new Document(); doc.add(new Str

Lucene 提升Kentico智能搜索结果相关性范围

标签： Lucene Kentico

我与Kentico smart search合作。我想扩大智能搜索结果的相关范围。我读过这篇文章，它描述了如何使用布尔字段进行操作。根据文章，我必须在Kentico页面中创建一个bool列，然后设置到智能搜索控件的搜索条件字段此代码： columnname:(true)^3 如果所需页面包含此列，且其值为true，则此页面相关性将增加。有效。现在我想对整型列做同样的处理。我想在本栏中保留一个系数，以增加相关性。我知道Kentico使用的是ApacheLucene搜索引擎，这是我以前

elasticsearch @IndexedEmbedded和@ContainedIn关系不起作用

标签：elasticsearch Lucene hibernate-search

当使用@IndexedEmbedded和@ContainedIn关系时，来自一个索引“A”的数据应更新为另一个索引“B”。但包含@IndexedEmbedded注释的实体仍然没有使用包含@ContainedIn注释的实体中的数据进行更新不确定，我做错了什么。但根据文件，这应该是可行的。一旦我更新了A，同样的情况也会反映在B上弹性DB结构，我相信很好。但是索引是空的但是当我手动将对象保存到弹性数据库时，HibernateMasterSearchIndex会更新 fullTextSession

elasticsearch 弹性Lucene查询无法与日期一起正常工作

标签：elasticsearch Lucene elastic-stack

我有一个简单的任务：获取上周状态为“已付”或“已完成”的弹性索引中的所有项目我尝试的是： GET /my_index/_search?q=((status:paid or status:done) and (created_at > "now-7d/d")) 有趣的是，如果我这样做的话 GET /my_index/_search?q=((status:paid or status:done) 我得到大约4k的结果，但如果我做整个查询，我得到600k。看来，如果我添加第二部分，某些东

Lucene演示中的Stopwords和词干

标签： Lucene stop-wordsstemming

关于Lucene演示，我有两个主要问题。Lucene演示是否在任何修改之前使用stopwords？堵住怎么办？如果是这样，它使用什么样的词干分析器？您指的是哪个演示如果是，那么答案是：（a）停止单词：不，它没有。它使用StandardAnalyzer（），在创建时不使用停止词（但如果您选择提供一些参数，它可以）（b）词干分析：不，它不使用词干分析-演示代码中没有涉及词干分析类，因为标准分析器没有使用词干分析请看一看javadoc，了解最新版本。您将看到以下内容：使用可配置的停止字

Lucene 如何将EdgeNGramTokenFilter添加到Compass查询？

标签： Lucene compass-lucene

我正在使用compass构建一些自动完成的功能，我需要向compass查询添加EdgeNGramTokenFilter，但我看不出如何添加它这可能吗？我创建了一个提供程序类，在compass.config.xml文件中添加了对它的引用，并在标记中添加了以下行，从而添加了EdgeGramTokenFilter过滤器 <analyzerFilter name="lower" type="EdgeNGramTokenFilterProvider"/> import org.apache

Lucene.NET：检索特定文档中使用的所有术语

标签： Lucene lucene.net

有没有一种方法可以将Lucene.NET索引中针对特定文档的所有条款都记录下来基本上，我希望能够根据文档的ID从索引中检索文档，然后找到在该文档中使用每个术语的频率。有人知道怎么做吗我可以找到与特定术语匹配的文档数量，但无法找到特定文档中包含的术语非常感谢, 在Lucene Java中，索引文档时，至少有一个选项是存储术语频率向量。术语频率向量只是文档给定字段中所有术语的列表，以及这些术语的使用频率。在运行时获取术语频率向量涉及使用相关文档的Lucene ID调用IndexReader中的

Lucene 坚果-如何通过小补丁爬行？

标签： Lucene Web Crawler nutch

我不能让Nutch靠一小块地为我爬行。我通过参数为-depth 7和-topN 10000的bin/nutch crawl命令启动它。它永远不会结束。仅当我的硬盘为空时结束。我需要做的是：开始用你的手去爬我的种子进一步发展的可能性轮廓线抓取20000页，然后索引它们再爬两万页面，索引它们并与合并第一个索引循环步骤3 n次也尝试了wiki中的脚本，但我找到的所有脚本都没有进一步的改进。如果我再次运行它们，它们会从一开始就执行所有操作。在脚本的最后，我有了和我开始爬网时相同的索引

lucene查询&x27；定期文件

标签： Lucene

我从lucene开始，在查询相关文档数组中找到每个术语返回的类，但没有成功更准确地说，在哪里可以找到决定文档是否与给定查询相关的代码我将非常感谢您的指导结果的问题是Lucene收集的不是所有结果，而是仅收集N个顶级结果（N由您设置）。这是一个好主意，因为它大大减少了搜索过程的时间，只生成您可能感兴趣的结果。虽然您可以将N设置为某个非常大的数字，对查询中的每个术语进行一次搜索，然后合并结果，但实际上我不建议这样做另一方面，您可以在搜索前组合术语，而不是在搜索后组合。我不熟悉zig-zag连接

结构化和非结构化索引-Lucene和Hbase

标签： Lucene Indexing Hbase

我有一套2亿份文档需要索引。每个文档都有一个自由文本和一组额外的稀疏元数据信息（100多列）似乎自由文本索引的正确工具是Lucene，而结构化稀疏元数据的正确工具是HBase 我需要查询数据，并在自由文本搜索结果和结构化数据结果之间进行连接（例如，获取所有文本中包含短语“早上好”且于1980年首次出版的书籍）我应该使用什么工具/机制来连接结构化和非结构化查询？结果可能包括数百万条记录（加入之前和之后）谢谢 Saar看起来HBase也需要一些Lucene操作：。除了HBase上的Lucen

Lucene 加速Solr索引

标签： Lucene Solr

我正在努力加快我的Solr索引速度。我只想知道Solr默认使用多少线程（如果有的话）进行索引。有没有办法增加/减少这个数字为文档编制索引时，将执行以下几个步骤：对文件进行分析, 数据被放入RAM缓冲区当RAM缓冲区已满时，数据将刷新到磁盘上的新段如果有多个${mergeFactor}段，则合并段前两个步骤将在尽可能多的线程中运行，就像客户端向Solr发送数据一样。因此，如果希望Solr为这些步骤运行三个线程，则只需从三个线程向Solr发送数据即可如果使用ConcurrentMer

Lucene “boost”对于文档和查询意味着什么？

标签： Lucene elasticsearch

我是Lucene的新手，我正试图了解更多关于增强文档和查询的信息。我发现了很多关于如何配置文档增强的文档，但是这意味着什么呢我现在能真正发现的是，它会影响评分，但我甚至不清楚在进行搜索时，较高或较低的值是否会导致更好的评分。我在谷歌和Lucene维基上搜索过，真的没有找到任何关于这到底是什么的一般性解释任何帮助都将不胜感激在Lucene中，您可以增强文档或字段。在文档的情况下，它的所有字段都将使用用于增强文档的值进行增强默认情况下，所有文档都没有提升，或者说它们都具有相同的提升因子1.0

Lucene Hibernate Search 4.1.1 NoSuchMethodError FSDirectory.open

标签： Lucene hibernate-search

我正在尝试将Hibernate Search 4.1.1-Final+Lucene 3.5与Hibernate 4.1.3和Spring 3.1.1框架（依赖关系使用Maven）结合使用，以启用基于POJO的文本搜索。我遵循了Hibernate搜索文档。根据文档，以下是我的Hibernate配置： <bean id="sessionFactory" class="org.springframework.orm.hibernate4.LocalSessionFactoryBe

Ravendb Live projections生成空值（Ravendb Lucene、Multimap、Live projections）

标签： Lucene Ravendb multimap

首先，我为我的英语感到抱歉，如果我能简单地说出我的问题，我会非常高兴我花了很多时间来解决多重地图索引和实时投影问题。我在stackoverflow、google、ayende博客等上读了太多。。。然而，这并不能解决我的问题我想要什么：我有一个应用程序，想要一个类似twitter的搜索，它是twitter搜索框，可以从多个来源进行搜索，比如twit内容、用户名和hashtags。当我得到结果时，我想将结果和形状索引结果的转换应用到FullSearchResult模型中。我还想知道结果在哪里。

Lucene 更新术语'；搜索前的s值

标签： Lucene

我正在使用Lucene 3.6.1 您知道在Lucene实际对包含该术语的文档执行搜索之前，是否有方法更改术语的值（Term.text（）我需要这个预处理，因为值在写入索引时是加密的。虽然我需要做模糊搜索和/或近似搜索时，搜索这个词致以最诚挚的问候。您想在找到索引之前更改存储在索引中的值吗？不，那没有道理如果在索引中存储加密数据，则需要使用加密数据进行搜索。如果您需要能够利用适当的文本搜索，只需以未加密的形式对其进行索引即可。我想，除非你使用了某种对文本搜索友好的加密方式。我想，如果它是一

Lucene ElasticSearch：使用短语对滚雪球过滤字段进行查询\u字符串搜索

标签： Lucene elasticsearch

我正在执行一个简单的查询\u字符串查询，如下所示： "query_string" : { "default_operator" : "AND", "fields" : ["title^20","keywords^10","description^8","content^1","titles^6","highlights^4"], "query" : "\"south west\"" } 然而，搜索将文档与不一定相邻的单词“南部”和“西部”进行匹配，例如“我们在英格兰南

如何突出Lucene 4.4中的每个事件？

标签： Lucene information-retrieval

我有一个非常特殊的语料库，每个文档实际上都是一个短段落我打算做的是突出显示搜索词的每一次出现，而不仅仅是像Highlighter类那样的片段例如：搜索“apple”，结果应如下所示：我每天吃一个苹果，因为一天一个苹果可以远离医生而不是 …每天吃苹果，因为… …一天一个苹果可以处理文本拆分（或分段）的方式。适用于您不需要任何碎片的情况，如： highlighter.setTextFragmenter(new NullFragmenter());

用于测试Lucene的图像包-Hibernate搜索

标签： Lucene hibernate-search

我们正在电子档案项目中使用Lucene。因为我们没有那么多（图像版本的）文档，所以我们需要某种图像包来测试lucene。我上网查了一下，但没有找到上面的关键词。有人知道在哪里可以找到这些信息吗？或者我应该使用什么样的关键字？你说的“图像”包是什么意思？你的意思是你有真实的图像（如gif或png）并想从中提取文本？在本例中，我们讨论的是OCR软件，它可以从图像中提取文本，然后将文本馈送给Lucene。或者我完全误解了你的意思；-）很抱歉给你带来了困惑。首先，我们必须对图像进行OCR，然后将结果反馈

Lucene elasticsearch是否有复合索引？

标签： Lucene elasticsearch

我想知道elasticsearch是否需要预先定义复合索引。所谓复合索引，我指的是mongodb所拥有的东西 ensureIndex（{field1:1，field2:1，field3:1}）或者类似mysql db的功能在mytable上创建索引adhoc_索引（字段1、字段2、字段3）因此，我所处理的数据非常简单（大部分只是csv格式）。（为了完整性）如下所示字段1，字段2，…，字段n 字段的数量是任意的。一个数据集可能有10个字段，另外20个字段，另外1000个字段。我基本上将每一

Lucene 特殊字符的使用

标签： Lucene Aem

我想使用CQs QueryBuilder进行全文搜索： type=cq:Page path=/content/page fulltext=#Employees 尝试这样做会给我匹配单词“Employees”的命中率，即使我在查询中使用hash作为“Employees” 无法看到QueryBuilder修改了查询，但Lucene是否可能删除了哈希我不确定cq5，但如果使用了StandardAnalyzer，Lucene确实会在标记化和查询时删除哈希键，如所示此代码 public static

Lucene.Net Searcher找不到新文档

标签： Lucene lucene.net

我有一个应用程序，用户可以在Lucene.NET（v3.0.3.0）中插入数据，几秒钟后就可以查询新数据目前，我正在为执行的每个查询创建一个新的IndexSearcher实例。据说这很慢，出于性能原因，建议使用IndexSeacher的缓存实例只要我将IndexSearcher保存在缓存中，查询就好像引用了旧数据。未找到新添加的文档我试着打电话 searcher.IndexReader.Reopen(); 但这没有帮助。只有以下代码才能确保搜索返回最新文档： Lucene.Net.Sto

elasticsearch 图表、方面、全文：最好的世界？

标签：elasticsearch Lucene Neo4j graph-databasesfaceted-search

Lucene，Elasticsearch：分面搜索，全文搜索，很棒 Neo4j，也许是泰坦：图形搜索令人惊叹但是，对于结合方面、全文和图形的查询，什么是好的策略呢？我不想将图形搜索结果具体化，并将其带入到分面/全文查询中。如何将这些世界结合起来以下是一个例子：方面–我们有“项目”和方面，如修改日期、状态、项目类型（以及更多；尽管这些项目的字段/方面甚至是可配置的，但合理的平均项目大约有20个方面）图形–这些“项目”彼此相关（我们经常谈论“上游”和“下游”项目/关系），它们以各种方式与

elasticsearch Kibana 3中表格面板中的不同值

标签：elasticsearch Lucene Kibana

假设我有ff。数据： column1 | column2 | column3 | column4 john 1 val3 val4 peter 2 val3 val4 john 3 val3 val4 peter 4 val3 val4 如果这是一个关系数据库，我会：从mytable中选择distinct column1 在基巴纳，我将如何实现这一目标？

elasticsearch all enabled为true，关键字令牌分析器不返回任何结果

标签：elasticsearch Lucene

我在下面给出的弹性搜索中使用关键字令牌分析器 { "settings" : { "analysis" : { "analyzer" : { "default" : { "type" : "keyword" } } } } } 我的订单映射在这里 { "order": { "

Lucene空间策略

标签： Lucene geospatialspatial

我有以下用例：我希望能够从给定的用户lat long搜索半径为x kms的特定圆圈内的lucene文档我还想按距离对文档进行排序我还需要稍后将distnace值显示给用户哪种空间策略最适合我，而无需编制任何额外索引并考虑性能。根据您的要求，我认为最好的选择可能是点向量策略，这是最简单的一种，同时也满足您的条件：在两个数值字段中表示点的简单空间策略。该策略的最佳特性是适当的距离排序特点：仅索引点；每个字段值只有一个可以按矩形或圆形进行查询支持SpatialOperation.

elasticsearch 从kibana使用lucene查询语法弹性搜索带撇号的字符串

标签：elasticsearch Lucene Kibana apostrophe

elasticsearch 是否有方法显示所选文档与ElasticSearch上的其他文档相似的百分比？

标签：elasticsearch Lucene

我需要使用Elasticsearch构建一个搜索引擎，步骤如下：使用搜索字符串在搜索引擎上搜索将显示相关结果，我可以单击这些文档如果我选择了一个文档，我将被重定向到另一个页面，在那里我将看到文档的所有详细信息，并将有一个选项“更像这样”（它将返回与所选文档类似的文档）。我知道这是使用MLT查询完成的现在我的问题是：除了返回与所选文档相似的文档外，如何还返回与所选文档相似的百分比你可以做几件事使用函数\u得分查询 more\u like\u这个查询本质上是一个全文搜索，它返回按相关性得