Lucene 所有这些词都有自己的特点

我有一个在Lucene中索引的“描述”字段。这个字段包含一本书的描述。 如何使用BooleanQuery类在该字段上实现“所有这些单词”功能? 例如,如果用户键入“畅销书”,则应返回描述中包含所有这些单词的书籍 谢谢 我相信如果您通过 并将第二个参数设置为常量booleansclause.occurrent.MUST,那么您应该得到您想要的。等效的查询语法是“+term1+term2+term3…”。有两个部分可以实现这一点: 您需要对传入的文档进行适当的分析,以便对单个单词分别进行标记和索引

在Lucene中将来自多个文档的点击组合成单个点击

我试图让一个特定的搜索工作,它被证明是有问题的。实际的源数据相当复杂,但可以通过以下示例进行总结: 我有一些文章被编入索引,所以 他们可以被搜查。每个 文章还具有多个属性 与之相关的 索引和搜索。当用户 搜索,他们可以在任何一个 主要文章或相关文章 财产。不管打到哪里 实现后,返回文章 作为搜索结果(即属性 他们自己永远不会成功) 现在谈谈复杂性: 每个财产都有担保, 这意味着对于任何给定的用户, 他们可能看不到,也可能看不到 财产。如果用户无法看到 财产,他们显然得不到 搜索成功了。这是安全检

Lucene ApacheSolr:由group by生成的数据总和

我们有一个要求,我们需要按特定字段对记录进行分组,并取相应数字字段的总和 e、 x.按用户ID从用户操作组中选择用户ID、总和(单击计数) 我们正在尝试使用apache solr实现这一点,并发现有两种实现方法: 正在使用字段折叠功能(),但发现了以下两个问题: 1.1. 这不是发行版的一部分,可以作为补丁提供,所以我们不确定是否可以在生产中使用它。 1.2. 我们不收回总额,而是单独计算,我们需要在客户端进行汇总 使用Stats组件和facetedsearch()。这满足了我们的要求,但对于非

Lucene 标记可以经常更改的标记文档的索引策略

除了文本内容之外,我的文档还有可以搜索的标签。现在的问题是,标记经常更改,每次添加或删除标记时,我都必须调用UpdateDocument,这对于数百个文档来说是非常缓慢的 对于经常更改并需要使用Lucene搜索的标签,是否有性能良好的存储策略?我一直在考虑将标记保存在单独的文档中,以使它们更小,但我不知道如何快速搜索标记和内容。将[tag,UID]对存储在关系数据库中。每次添加或更新标记时,都会在数据库的该表中添加和更新该标记 当执行包含标记数据(存储在数据库中)和内容(在Lucene中编制索引

如何在Solrnet/Solr(Lucene)中实现分组?

我有根据PageID(UniqueKey)索引的Lucene文件。一个文档可以有多个页面。现在,一旦用户执行一些搜索,它就会给我们提供匹配搜索条件的页面 我正在使用Lucene.NET2.9.2 我们有两个问题 1-文件大小约为800GB,有1.3亿行(页),因此搜索速度非常慢(所有查询都需要一分钟以上的时间(我们一次只需返回有限的行) 为了克服性能问题,我转向SOLR,它解决了性能问题(这很奇怪,因为我没有使用SOLR提供的任何额外功能,如切分等-所以可能是Lucene.NET 2.9.2与J

如何从Lucene 3.0.3获得可靠的docid?

我想获取刚刚添加到Lucene索引中的文档的int docid,这样我就可以将其粘贴到过滤器中以更新一个长期查询。我的文档具有唯一的外部id,因此我认为对唯一id执行TermDocs枚举将返回正确的文档,如下所示: protected int getDocId(IndexReader reader, String idField, Document doc) throws IOException { String id = doc.get(idField); TermDocs t

Lucene 你如何标记这些花?

我有一块价值1800英镑的田地。当我对它进行索引时,我希望将它标记为1800朵、1800朵、1800朵,然后最终n-grammed。 目前,我已经编写了自己的filterfactory来完成这项工作。然而,我想知道Solr是否可以用现有的标记器和过滤器来实现这一点。任何人对此有更好的解决方案吗?您可以尝试使用。模式标记器可能会帮助我从1800Flowers中获得1800和Flowers,但我希望保留原始术语。您可以使用不同的标记器添加copyfield

Lucene 按solr中多值字段的特定值排序

我有一个Solr索引,它在每个文档的多值字段中存储日期 我需要有能力搜索一个日期范围(做到这一点),但也排序结果集的日期,其中日期是多值字段的第一个日期,属于范围内 如果我尝试使用一个函数进行排序,它会告诉我它不能在多值字段上使用字段Caceh 有没有可能让一个函数在查询中填充一个字段,然后按该字段排序,或者使用另一个选项,或者唯一的选项是使用联接、按联接排序,然后字段折叠 由于搜索的复杂性和连接的数量,我真的不能使用SQL,所以我希望有一种方法可以完成这项工作,而不会回到类似SQL的范例。您可

在lucene中搜索日期可用性的最佳方法

我有一个场景,其中我有一个对象,该对象与可用性属性关联。我将一个月内的日期编码为32位二进制,1表示可用,0表示不可用。现在我想搜索在一定日期范围内可用的对象。我怎样才能最好地与lucene合作 也许更好的存储方式是: available_on=20111028 available_on=20111029 其中,日期编码为整数,每个可用日期对应一个字段。然后可以使用NumericRangeQuery搜索可用性范围 如果做不到这一点,我想您可以编写一个过滤器,逐级检查用于位字段的每个值,然后选择

尝试从命令行运行lucene应用程序时,未找到类定义错误

我是lucene的初学者,我曾尝试运行网站上给出的示例应用程序(helloluce.java)。代码已成功编译,并为应用程序创建了一个类文件(helloluce.class) 但在尝试运行应用程序时,出现以下错误 无法找到或加载主类HelloUser 我参考了链接并尝试了提供的解决方案,但都是徒劳的。请帮我解决这个问题 我用来运行代码的命令是 爪哇岛 我尝试运行的代码: import org.apache.lucene.analysis.standard.StandardAnalyzer

Lucene 如何触发alfresco存储库的重新索引?

每当我对某个人的location属性执行lucene搜索查询时,我都会得到一个小于预期的人列表。但是,我注意到,如果我创建了新的人员,他们会被包括在列表中,但是已经存在的用户(从备份恢复的回购数据)更改和更新位置时,他们不会被包括在集合中。因此,我怀疑需要对存储库重新编制索引。这取决于您使用的是旧的事务内Lucene索引,还是新的SOLR索引 如果您使用的是SOLR,步骤如下。基本上,停止托管SOLR的Tomcat,删除索引目录和模型目录,然后重新启动它。SOLR然后将对索引进行干净的重建。如果

基于特定字段的过滤lucene搜索

我想返回在具有特定值的文档之后找到的所有匹配文档。该值是唯一的。 我尝试过使用数字过滤。这不是一个好的解决方案,因为字段值可能是任意顺序的如果我了解您的需要,使用数字范围是获取所需内容的正确方法。为了在同一字段上排序,您需要向搜索调用传递一个参数,类似于: Sort sort = new Sort(new SortField("myNumericField", SortField.Type.INT)); searcher.search(query, maxDocs, sort) 在搜索中遇到某

Lucene索引搜索通配符不匹配

我有一个索引,我正在使用Luke测试一些查询。有一个案例让我感到困惑 在索引中,我有以下名称: 走 走!克鲁格 走!纳米比亚 高尔夫球手 当我将SimpleAnalyzer与以下查询名称一起使用时:go我得到了预期的结果,go!在列表的顶部。但是,当我在查询中使用通配符时,Name:go*我得到的结果除了go!或其任何衍生物。Golfer仅在运行通配符查询时返回 我的理解是,星号通配符*的功能是零个或多个匹配项,还是我的理解不正确 感叹号似乎不算作索引中的字符。我知道这是一个保留的查询字符 我是

胡萝卜2 3.8.1未读取lucene 4.6.0指数

当尝试在lucene索引上使用集群时,我得到以下错误: 处理错误:org.apache.lucene.index.indexformattooneweexception:不支持格式版本(资源:ChecksumIndexInput(SimpleFSIndexInput(path=“M:\files\projects\LombardiNetworks\lucene\index\segments\u 1”)):1(需要>介于0和0之间) org.apache.lucene.index.indexfor

在C#NEST中选择Lucene/Elastic搜索荧光灯

我还没有找到这个属性在C#NEST中的位置或是否公开。例如,在弹性搜索中,您可以指定普通荧光灯,如下所示: { "size": 500, "query": { "query_string": { "query": "\"C S M\"", "fields": [ "contentsStem" ], "default_operator": "and" } }, "highlight": { "

带通配符的Lucene短语查询

我提出了一个解决方案,使用以下代码以编程方式创建查询来搜索带有通配符的短语: public static Query createPhraseQuery(String[] phraseWords, String field) { SpanQuery[] queryParts = new SpanQuery[phraseWords.length]; for (int i = 0; i < phraseWords.length; i++) { WildcardQ

elasticsearch 有没有一种方法可以在搜索查询中表示;省略字段的长度“;在弹性搜索?

省略字段长度的唯一解决方案是放置/更改文档的映射,并重新索引我不想要的整个数据 有没有办法在查询时忽略字段的长度?如果长度筛选是由分析器内的执行的,则筛选出的术语将不会出现在反向索引中 因此,您将无法使用查询搜索缺少的术语-您需要更新分析器并重新编制索引

elasticsearch 在弹性搜索中访问Lucene查询';s本机脚本记分器

我想编写一个自定义的弹性搜索计分器,它从索引中的文档中获取所有术语,从查询中获取所有术语,并基于一些自定义逻辑计算分数 经过一些研究,在Java中实现弹性搜索中的自定义记分器最直接的方法似乎是使用其“本机脚本”功能(即实现AbstractDoubleSearchScript)。我遇到的问题是,我找不到在这样的脚本中访问原始查询对象的方法。我只能访问匹配的文档及其字段。是否有某种方法可以访问用于搜索的查询对象 或者,使用我自己的(复杂的)算法(需要知道查询和文档的完整术语列表)对每个结果运行自定义

elasticsearch 按日期字段中的时间范围获取对象elasticsearch

elasticsearch中的文档映射中有一个日期字段,名为ConversationsPostDate "conversationSMPostDate": { "format": "yyyy-MM-dd HH:mm:ss", "type": "date" } 我想在从午夜到上午9点的时间范围内获得一些数据统计数据 我尝试使用过滤器组合多个通配符,但没有成功。我搜索了一下,找不到一个方法来做这个。我想做一些类似的事情 您好,我不确定这在elasticsearch中如何实现,但使用lucene

使用Lucene.Net的多个应用程序实例

我正在开发一个WPF应用程序,它使用Lucene.Net对第三方进程生成的文件中的数据进行索引。它的容量很小,每分钟只创建一次新文件 我的应用程序使用启动时创建的singletonIndexWriter实例。类似地,启动时也会创建indexsearch,但每当发生IndexWriter.Commit()时会重新创建,以确保新添加的文档将出现在搜索结果中 无论如何,有些用户需要运行应用程序的两个实例,但问题是,在第二个实例中搜索时,新添加的文档不会显示。我猜这是因为第一个实例正在进行提交,需要有一

elasticsearch Elasticsearch查询时间提升导致结果顺序不正确

在对每个关键字应用boost功能后,给定搜索关键字一二三的ES搜索结果似乎是错误的。请帮助我修改我的“错误”查询,以实现下面我描述的“预期结果”。我和LUCENE在ES1.7.4上4.10.4 提升标准-三个被视为最重要的关键词: ES索引内容-只显示MySQL转储,以缩短文章 预期ES查询结果-用户正在搜索一二三。我不担心分数相等的记录的顺序。我的意思是如果记录6和13切换位置,我不介意 ES查询 curl -XPOST "http://127.0.0.1:9200/_search?post_

elasticsearch 弹性搜索中整数类型优于字符串字段类型

我想知道与字符串类型相比,除了整型字段类型的类型验证之外,还有什么其他优势。据我所知,在Lucene索引中,这些字段无论如何都是以公共字节格式存储的 我问这个问题的原因是我有一个字段值,它可以是字符串也可以是整数。我在考虑是否应该在映射中创建不同的类型,即localhost:9200/index/string_type和localhost:9200/index/integer_type,或者我可以安全地(在性能和其他方面)为这两个变体使用字符串类型 我使用的是elastic 2.4。实际上,您可

可以在特定的Lucene文档中找到常用词吗? 例如:

结果:{{“doc1”、“doc2”、“doc3”}、{“苹果”、“iPhone”}或类似的东西 其他问题:是否有更好的库/系统使用Lucene的数据来实现此目的?是的,您可以使用术语向量来检索此信息 首先,您需要确保术语向量存储在索引中,例如: private static Document createDocument(String title, String content) { Document doc = new Document(); doc.add(new Str

Lucene 提升Kentico智能搜索结果相关性范围

我与Kentico smart search合作。 我想扩大智能搜索结果的相关范围。 我读过这篇文章,它描述了如何使用布尔字段进行操作。 根据文章,我必须在Kentico页面中创建一个bool列,然后设置到智能搜索控件的搜索条件字段此代码: columnname:(true)^3 如果所需页面包含此列,且其值为true,则此页面相关性将增加。 有效。 现在我想对整型列做同样的处理。我想在本栏中保留一个系数,以增加相关性。 我知道Kentico使用的是ApacheLucene搜索引擎,这是我以前

elasticsearch @IndexedEmbedded和@ContainedIn关系不起作用

当使用@IndexedEmbedded和@ContainedIn关系时,来自一个索引“A”的数据应更新为另一个索引“B”。但包含@IndexedEmbedded注释的实体仍然没有使用包含@ContainedIn注释的实体中的数据进行更新 不确定,我做错了什么。但根据文件,这应该是可行的。一旦我更新了A,同样的情况也会反映在B上 弹性DB结构,我相信很好。但是索引是空的 但是当我手动将对象保存到弹性数据库时,HibernateMasterSearchIndex会更新 fullTextSession

elasticsearch 弹性Lucene查询无法与日期一起正常工作

我有一个简单的任务: 获取上周状态为“已付”或“已完成”的弹性索引中的所有项目 我尝试的是: GET /my_index/_search?q=((status:paid or status:done) and (created_at > "now-7d/d")) 有趣的是,如果我这样做的话 GET /my_index/_search?q=((status:paid or status:done) 我得到大约4k的结果,但如果我做整个查询,我得到600k。看来,如果我添加第二部分,某些东

Lucene演示中的Stopwords和词干

关于Lucene演示,我有两个主要问题。Lucene演示是否在任何修改之前使用stopwords? 堵住怎么办?如果是这样,它使用什么样的词干分析器?您指的是哪个演示 如果是,那么答案是: (a) 停止单词:不,它没有。它使用StandardAnalyzer(),在创建时不使用停止词(但如果您选择提供一些参数,它可以) (b) 词干分析:不,它不使用词干分析-演示代码中没有涉及词干分析类,因为标准分析器没有使用词干分析 请看一看javadoc,了解最新版本。您将看到以下内容: 使用可配置的停止字

Lucene 如何将EdgeNGramTokenFilter添加到Compass查询?

我正在使用compass构建一些自动完成的功能,我需要向compass查询添加EdgeNGramTokenFilter,但我看不出如何添加它 这可能吗?我创建了一个提供程序类,在compass.config.xml文件中添加了对它的引用,并在标记中添加了以下行,从而添加了EdgeGramTokenFilter过滤器 <analyzerFilter name="lower" type="EdgeNGramTokenFilterProvider"/> import org.apache

Lucene.NET:检索特定文档中使用的所有术语

有没有一种方法可以将Lucene.NET索引中针对特定文档的所有条款都记录下来 基本上,我希望能够根据文档的ID从索引中检索文档,然后找到在该文档中使用每个术语的频率。有人知道怎么做吗 我可以找到与特定术语匹配的文档数量,但无法找到特定文档中包含的术语 非常感谢, 在Lucene Java中,索引文档时,至少有一个选项是存储术语频率向量。术语频率向量只是文档给定字段中所有术语的列表,以及这些术语的使用频率。在运行时获取术语频率向量涉及使用相关文档的Lucene ID调用IndexReader中的

Lucene 坚果-如何通过小补丁爬行?

我不能让Nutch靠一小块地为我爬行。我通过参数为-depth 7和-topN 10000的bin/nutch crawl命令启动它。它永远不会结束。仅当我的硬盘为空时结束。我需要做的是: 开始用你的手去爬我的种子 进一步发展的可能性 轮廓线 抓取20000页,然后 索引它们 再爬两万 页面,索引它们并与合并 第一个索引 循环步骤3 n次 也尝试了wiki中的脚本,但我找到的所有脚本都没有进一步的改进。如果我再次运行它们,它们会从一开始就执行所有操作。在脚本的最后,我有了和我开始爬网时相同的索引

lucene查询&x27;定期文件

我从lucene开始,在查询相关文档数组中找到每个术语返回的类,但没有成功 更准确地说,在哪里可以找到决定文档是否与给定查询相关的代码 我将非常感谢您的指导结果的问题是Lucene收集的不是所有结果,而是仅收集N个顶级结果(N由您设置)。这是一个好主意,因为它大大减少了搜索过程的时间,只生成您可能感兴趣的结果。虽然您可以将N设置为某个非常大的数字,对查询中的每个术语进行一次搜索,然后合并结果,但实际上我不建议这样做 另一方面,您可以在搜索前组合术语,而不是在搜索后组合。我不熟悉zig-zag连接

结构化和非结构化索引-Lucene和Hbase

我有一套2亿份文档需要索引。每个文档都有一个自由文本和一组额外的稀疏元数据信息(100多列) 似乎自由文本索引的正确工具是Lucene,而结构化稀疏元数据的正确工具是HBase 我需要查询数据,并在自由文本搜索结果和结构化数据结果之间进行连接(例如,获取所有文本中包含短语“早上好”且于1980年首次出版的书籍) 我应该使用什么工具/机制来连接结构化和非结构化查询? 结果可能包括数百万条记录(加入之前和之后) 谢谢 Saar看起来HBase也需要一些Lucene操作:。除了HBase上的Lucen

Lucene 加速Solr索引

我正在努力加快我的Solr索引速度。我只想知道Solr默认使用多少线程(如果有的话)进行索引。有没有办法增加/减少这个数字 为文档编制索引时,将执行以下几个步骤: 对文件进行分析, 数据被放入RAM缓冲区 当RAM缓冲区已满时,数据将刷新到磁盘上的新段 如果有多个${mergeFactor}段,则合并段 前两个步骤将在尽可能多的线程中运行,就像客户端向Solr发送数据一样。因此,如果希望Solr为这些步骤运行三个线程,则只需从三个线程向Solr发送数据即可 如果使用ConcurrentMer

Lucene “boost”对于文档和查询意味着什么?

我是Lucene的新手,我正试图了解更多关于增强文档和查询的信息。我发现了很多关于如何配置文档增强的文档,但是这意味着什么呢 我现在能真正发现的是,它会影响评分,但我甚至不清楚在进行搜索时,较高或较低的值是否会导致更好的评分。我在谷歌和Lucene维基上搜索过,真的没有找到任何关于这到底是什么的一般性解释 任何帮助都将不胜感激 在Lucene中,您可以增强文档或字段。在文档的情况下,它的所有字段都将使用用于增强文档的值进行增强 默认情况下,所有文档都没有提升,或者说它们都具有相同的提升因子1.0

Lucene Hibernate Search 4.1.1 NoSuchMethodError FSDirectory.open

我正在尝试将Hibernate Search 4.1.1-Final+Lucene 3.5与Hibernate 4.1.3和Spring 3.1.1框架(依赖关系使用Maven)结合使用,以启用基于POJO的文本搜索。我遵循了Hibernate搜索文档。根据文档,以下是我的Hibernate配置: <bean id="sessionFactory" class="org.springframework.orm.hibernate4.LocalSessionFactoryBe

Ravendb Live projections生成空值(Ravendb Lucene、Multimap、Live projections)

首先,我为我的英语感到抱歉,如果我能简单地说出我的问题,我会非常高兴 我花了很多时间来解决多重地图索引和实时投影问题。我在stackoverflow、google、ayende博客等上读了太多。。。然而,这并不能解决我的问题 我想要什么: 我有一个应用程序,想要一个类似twitter的搜索,它是twitter搜索框,可以从多个来源进行搜索,比如twit内容、用户名和hashtags。当我得到结果时,我想将结果和形状索引结果的转换应用到FullSearchResult模型中。我还想知道结果在哪里。

Lucene 更新术语';搜索前的s值

我正在使用Lucene 3.6.1 您知道在Lucene实际对包含该术语的文档执行搜索之前,是否有方法更改术语的值(Term.text() 我需要这个预处理,因为值在写入索引时是加密的。虽然我需要做模糊搜索和/或近似搜索时,搜索这个词 致以最诚挚的问候。您想在找到索引之前更改存储在索引中的值吗?不,那没有道理 如果在索引中存储加密数据,则需要使用加密数据进行搜索。如果您需要能够利用适当的文本搜索,只需以未加密的形式对其进行索引即可。我想,除非你使用了某种对文本搜索友好的加密方式。我想,如果它是一

Lucene ElasticSearch:使用短语对滚雪球过滤字段进行查询\u字符串搜索

我正在执行一个简单的查询\u字符串查询,如下所示: "query_string" : { "default_operator" : "AND", "fields" : ["title^20","keywords^10","description^8","content^1","titles^6","highlights^4"], "query" : "\"south west\"" } 然而,搜索将文档与不一定相邻的单词“南部”和“西部”进行匹配,例如“我们在英格兰南

如何突出Lucene 4.4中的每个事件?

我有一个非常特殊的语料库,每个文档实际上都是一个短段落 我打算做的是突出显示搜索词的每一次出现,而不仅仅是像Highlighter类那样的片段 例如: 搜索“apple”,结果应如下所示: 我每天吃一个苹果,因为一天一个苹果可以远离医生 而不是 …每天吃苹果,因为… …一天一个苹果可以 处理文本拆分(或分段)的方式。适用于您不需要任何碎片的情况,如: highlighter.setTextFragmenter(new NullFragmenter());

用于测试Lucene的图像包-Hibernate搜索

我们正在电子档案项目中使用Lucene。因为我们没有那么多(图像版本的)文档,所以我们需要某种图像包来测试lucene。我上网查了一下,但没有找到上面的关键词。有人知道在哪里可以找到这些信息吗?或者我应该使用什么样的关键字?你说的“图像”包是什么意思?你的意思是你有真实的图像(如gif或png)并想从中提取文本?在本例中,我们讨论的是OCR软件,它可以从图像中提取文本,然后将文本馈送给Lucene。或者我完全误解了你的意思;-)很抱歉给你带来了困惑。首先,我们必须对图像进行OCR,然后将结果反馈

Lucene elasticsearch是否有复合索引?

我想知道elasticsearch是否需要预先定义复合索引。所谓复合索引,我指的是mongodb所拥有的东西 ensureIndex({field1:1,field2:1,field3:1}) 或者类似mysql db的功能 在mytable上创建索引adhoc_索引(字段1、字段2、字段3) 因此,我所处理的数据非常简单(大部分只是csv格式)。(为了完整性)如下所示 字段1,字段2,…,字段n 字段的数量是任意的。一个数据集可能有10个字段,另外20个字段,另外1000个字段。我基本上将每一

Lucene 特殊字符的使用

我想使用CQs QueryBuilder进行全文搜索: type=cq:Page path=/content/page fulltext=#Employees 尝试这样做会给我匹配单词“Employees”的命中率,即使我在查询中使用hash作为“Employees” 无法看到QueryBuilder修改了查询,但Lucene是否可能删除了哈希 我不确定cq5,但如果使用了StandardAnalyzer,Lucene确实会在标记化和查询时删除哈希键,如所示 此代码 public static

Lucene.Net Searcher找不到新文档

我有一个应用程序,用户可以在Lucene.NET(v3.0.3.0)中插入数据,几秒钟后就可以查询新数据 目前,我正在为执行的每个查询创建一个新的IndexSearcher实例。据说这很慢,出于性能原因,建议使用IndexSeacher的缓存实例 只要我将IndexSearcher保存在缓存中,查询就好像引用了旧数据。未找到新添加的文档 我试着打电话 searcher.IndexReader.Reopen(); 但这没有帮助。只有以下代码才能确保搜索返回最新文档: Lucene.Net.Sto

elasticsearch 图表、方面、全文:最好的世界?

Lucene,Elasticsearch:分面搜索,全文搜索,很棒 Neo4j,也许是泰坦:图形搜索令人惊叹 但是,对于结合方面、全文和图形的查询,什么是好的策略呢?我不想将图形搜索结果具体化,并将其带入到分面/全文查询中。如何将这些世界结合起来 以下是一个例子: 方面–我们有“项目”和方面,如修改日期、状态、项目类型(以及更多;尽管这些项目的字段/方面甚至是可配置的,但合理的平均项目大约有20个方面) 图形–这些“项目”彼此相关(我们经常谈论“上游”和“下游”项目/关系),它们以各种方式与

elasticsearch Kibana 3中表格面板中的不同值

假设我有ff。数据: column1 | column2 | column3 | column4 john 1 val3 val4 peter 2 val3 val4 john 3 val3 val4 peter 4 val3 val4 如果这是一个关系数据库,我会: 从mytable中选择distinct column1 在基巴纳,我将如何实现这一目标?

Lucene空间策略

我有以下用例: 我希望能够从给定的用户lat long搜索半径为x kms的特定圆圈内的lucene文档 我还想按距离对文档进行排序 我还需要稍后将distnace值显示给用户 哪种空间策略最适合我,而无需编制任何额外索引并考虑性能。根据您的要求,我认为最好的选择可能是点向量策略,这是最简单的一种,同时也满足您的条件: 在两个数值字段中表示点的简单空间策略。 该策略的最佳特性是适当的距离排序 特点: 仅索引点;每个字段值只有一个 可以按矩形或圆形进行查询 支持SpatialOperation.

elasticsearch 从kibana使用lucene查询语法弹性搜索带撇号的字符串

我有如下的参赛作品: 信息: 2017-10-18 19:32:28243 | httpSSLWorkerThread-28080-53 | 754883 | XYZ | server1 | INFO | ElpasedTime-(0'1''2ms)|从中选择* 国家@时间戳: 2017年10月18日19:32:49.000 tag:sometag.somefile.log _身份证: AV8wi3hgkonXqExERTgE _类型: 弗伦特 _索引: logstash-2017.10.18

elasticsearch 是否有方法显示所选文档与ElasticSearch上的其他文档相似的百分比?

我需要使用Elasticsearch构建一个搜索引擎,步骤如下: 使用搜索字符串在搜索引擎上搜索 将显示相关结果,我可以单击这些文档 如果我选择了一个文档,我将被重定向到另一个页面,在那里我将看到文档的所有详细信息,并将有一个选项“更像这样”(它将返回与所选文档类似的文档)。我知道这是使用MLT查询完成的 现在我的问题是:除了返回与所选文档相似的文档外,如何还返回与所选文档相似的百分比 你可以做几件事 使用函数\u得分查询 more\u like\u这个查询本质上是一个全文搜索,它返回按相关性得

上一页 1 2 ...  28   29   30   31    32   33   34  ... 下一页 最后一页 共 78 页