elasticsearch,tire,truncation,Html,Ruby On Rails,elasticsearch,Tire,Truncation" /> elasticsearch,tire,truncation,Html,Ruby On Rails,elasticsearch,Tire,Truncation" />

如何获取elasticsearch的突出显示功能以截断HTML

如何获取elasticsearch的突出显示功能以截断HTML,html,ruby-on-rails,elasticsearch,tire,truncation,Html,Ruby On Rails,elasticsearch,Tire,Truncation,目前正在Rails应用程序中开发搜索功能,用于索引数据 我的数据包括html。问题是,当我查询elasticsearch索引并启用高亮显示以高亮显示与搜索词匹配的单词时,它通常会返回一个包含打开的html标记的字符串。有没有办法告诉elasticsearch数据包含html 返回内容的示例: 其中-at Your Startup>是链接的href属性 我知道用于突出显示的encode选项,但它不会截断html,只是将其转义。有没有办法让elasticsearch截断highlight.title

目前正在Rails应用程序中开发搜索功能,用于索引数据

我的数据包括html。问题是,当我查询elasticsearch索引并启用高亮显示以高亮显示与搜索词匹配的单词时,它通常会返回一个包含打开的html标记的字符串。有没有办法告诉elasticsearch数据包含html

返回内容的示例:

其中-at Your Startup>是链接的href属性

我知道用于突出显示的encode选项,但它不会截断html,只是将其转义。有没有办法让elasticsearch截断highlight.title字段


谢谢

通常,我们使用HTML标记对数据进行索引,并在该索引字段中进行搜索。所以这个字段不包含HTML标记,因此您不会面临当前面临的问题。我猜您的意思是没有HTML标记?问题是,我尝试在通过Sanitize.fragment或Nokogiri函数传递它之后对其进行索引,但是返回的突出显示文本将在url上中断。是。没有HTML标签。但是我不明白你在做了那件事之后会面临什么问题。如果我在索引中没有HTML标记,那么内容中仍然有URL。因此,当我尝试获取高亮显示的字段并允许它使用lucene highlighter或postings highlighter返回片段时,它经常在url上中断。也就是说,片段的开头或结尾具有url的前导或尾随部分。
-at-Your-Startup">blah system, and blah is a great, to metrics at any time, and it's also the go to place to prepare for blah.  As part of the blah