elasticsearch 如何从分数计算中提取(别名字段的长度),elasticsearch,search,elasticsearch-7,elasticsearch,Search,Elasticsearch 7" /> elasticsearch 如何从分数计算中提取(别名字段的长度),elasticsearch,search,elasticsearch-7,elasticsearch,Search,Elasticsearch 7" />

elasticsearch 如何从分数计算中提取(别名字段的长度)

elasticsearch 如何从分数计算中提取(别名字段的长度),elasticsearch,search,elasticsearch-7,elasticsearch,Search,Elasticsearch 7,假设我们有一个包含姓名和别名的文档,如下所示: { name: "Christian", aliases: ["נוצרי", "کریستیان" ] } 假设我有一个有10个别名的文档,另一个有2个别名 但它们都包含值为的别名 第一个文档的字段长度(dl)大于第二个文档 因此,第一个文档的术语频率(tf)会低于第二个文档。最终,别名较少的文档的分数会比另一个文档的分数高 有时我想为不同语言和不同形式的人添加更多别名,因为他/她更出名,但这会导致结果得分较低。我想从查询的计算中减

假设我们有一个包含姓名和别名的文档,如下所示:

{
   name: "Christian",
   aliases: ["נוצרי", "کریستیان" ]
}
假设我有一个有10个别名的文档,另一个有2个别名 但它们都包含值为
的别名

第一个文档的
字段长度(dl)
大于第二个文档 因此,第一个文档的
术语频率(tf)
会低于第二个文档。最终,别名较少的文档的分数会比另一个文档的分数高

有时我想为不同语言和不同形式的人添加更多别名,因为他/她更出名,但这会导致结果得分较低。我想从查询的计算中减去别名字段的长度。

存储字段的相对长度

场地有多长?场地越短,重量越高。 如果一个术语出现在一个较短的字段中,例如标题字段,则该术语更为重要 该字段的内容可能与术语有关,而不是 同样的术语出现在更大的身体领域

可以使用PUT映射api禁用规范

PUT my_index/_mapping
{
  "properties": {
    "title": {
      "type": "text",
      "norms": false
    }
  }
}
进一步研究的链接


  • 禁用字段“properties”的规范:{“title”:{“type”:“text”,“norms”:false}}这刚刚保存了my day@jaspreetchahal