Lucene 为产品搜索构建搜索引擎

Lucene 为产品搜索构建搜索引擎,lucene,search-engine,Lucene,Search Engine,我们想为在线/离线产品建立一个搜索引擎。我们开始在网上冲浪,开始了解倒排索引、TF/IDF和其他与搜索相关的通用算法等技术。我们使用了lucene,它内置了所有上述技术,我们的基本搜索平台已经准备就绪 后来我们意识到,通用搜索引擎将返回任何类型的输出。 假设我搜索“black shoes”,搜索字符串输出将包含同时包含black和shoes的输出。所以在产量上,很可能会有一件黑色衬衫,但相关性较小 所以我们认为产品分类可以拯救我们。我们将根据产品所携带的属性对产品进行分类,然后以同样的方式解析查

我们想为在线/离线产品建立一个搜索引擎。我们开始在网上冲浪,开始了解倒排索引、TF/IDF和其他与搜索相关的通用算法等技术。我们使用了lucene,它内置了所有上述技术,我们的基本搜索平台已经准备就绪

后来我们意识到,通用搜索引擎将返回任何类型的输出。 假设我搜索“black shoes”,搜索字符串输出将包含同时包含black和shoes的输出。所以在产量上,很可能会有一件黑色衬衫,但相关性较小

所以我们认为产品分类可以拯救我们。我们将根据产品所携带的属性对产品进行分类,然后以同样的方式解析查询字符串,以挖掘用户正在寻找的内容并直接匹配它们。我不确定这是否是我们应该遵循的方式


因此,我想知道为利基市场构建搜索引擎通常采用的不同技术是什么???

Lucene无疑是构建搜索引擎时可以使用的顶级API之一。无论如何,我建议你使用

Solr在引擎盖下使用Lucene,但为您提供了许多内置功能和令人惊叹的视觉控制台

关于你的问题,正如经常发生的那样,这里不是工具使用的问题,而是你如何使用它。您可以使用Lucene/Solr自定义搜索行为以获得所需的结果

无论如何,您有两种选择可以单独采用,也可以一起采用:

1) 创建一组可供选择的上下文。例如,亚马逊搜索允许您在与产品相关的不同上下文中进行选择(例如“所有部门”、“美容”、“游戏”等)。这个技巧将帮助你缩小产品的范围

2) 在slop 1中使用扳手查询或短语查询,并通过接近度来增强它们


显然,如果索引中的文档是以最适合您的结构创建的,那么前面的选项将对您有所帮助。

非常感谢您的建议。我肯定会读到有关PanerarQuery的文章,并尝试在我们的应用程序中实现它。