在Solr中使用关键字列表在电子邮件内容中进行全文搜索

在Solr中使用关键字列表在电子邮件内容中进行全文搜索,solr,lucene,Solr,Lucene,我正在写一个应用程序,我想用一组关键字扫描电子邮件内容(正文/主题)(在高流量电子邮件服务器上) 我的关键字列表大约为400K(每天都在变化),我使用SOLR并将我的关键字作为索引索引(关键字还包含各种字段,如firstname、lastname、goods等) 现在的问题是,如何通过SOLR查询用关键字搜索电子邮件正文(即自由文本数据) 例如,我的关键字是“XYZ Wines”,如果电子邮件正文显示“嗨,这是XYZ,我正在给你发送一些葡萄酒”或“嗨,给你发送一些XYZ葡萄酒,谢谢你的业务”,在

我正在写一个应用程序,我想用一组关键字扫描电子邮件内容(正文/主题)(在高流量电子邮件服务器上)

我的关键字列表大约为400K(每天都在变化),我使用SOLR并将我的关键字作为索引索引(关键字还包含各种字段,如firstname、lastname、goods等)

现在的问题是,如何通过SOLR查询用关键字搜索电子邮件正文(即自由文本数据)


例如,我的关键字是“XYZ Wines”,如果电子邮件正文显示“嗨,这是XYZ,我正在给你发送一些葡萄酒”或“嗨,给你发送一些XYZ葡萄酒,谢谢你的业务”,在这两种情况下,我应该会得到不同搜索分数的搜索结果。

索引你的电子邮件,然后搜索
+XYZ+葡萄酒
(或者更好地设置
q.op=和
)并用于提高术语接近度。

技术上,我可能无法为电子邮件编制索引,因为数量太大……如果我为电子邮件编制索引,我可能需要查询每个关键字(100个或数千个)在电子邮件内容方面……@Rushik:我不确定你的意思……显然Solr/Lucene只能在索引中搜索。同样,用Solr索引电子邮件非常容易,请参见sure Mauricio,我完全理解,但我不想在索引的电子邮件中查询每个关键字(数千个),而可能会预先处理电子邮件正文(删除常用术语等)电子邮件搜索中的每个词都有索引关键字。@Rushik:对不起,我真的不明白。似乎你想在不实际运行任何查询的情况下获得点击率?这没有多大意义,所以我可能遗漏了一些内容。很抱歉,我最初的想法是索引关键字(XYZ Wines等),查询将是“电子邮件内容”因此,如果查询词中的任何一个都是索引关键字的一部分,请考虑为命中。根据您的建议,如果我索引电子邮件,我需要考虑所有关键字作为查询(逐一)。