Sphinx 斯芬克斯与词形

Sphinx 斯芬克斯与词形,sphinx,Sphinx,我怎样才能让斯芬克斯把“auto”和“car”识别为相似的词呢 让我们想象一下,我有三条数据库记录 Andy likes to drive auto. Mary don't like to drive car. Bob is going to buy automobile. 下面是示例查询及其结果 query: car result: Mary don't like to drive car. ------------------------------------- query: auto

我怎样才能让斯芬克斯把“auto”和“car”识别为相似的词呢

让我们想象一下,我有三条数据库记录

Andy likes to drive auto.
Mary don't like to drive car.
Bob is going to buy automobile.
下面是示例查询及其结果

query: car
result: Mary don't like to drive car.
-------------------------------------
query: auto
result: Andy likes to drive auto.
-------------------------------------
query: automobile
Bob is going to buy automobile.
…但我想让斯芬克斯回来

query: car
result:
Andy likes to drive auto.
Mary don't like to drive car.
Bob is going to buy automobile.
-------------------------------------
query: auto
result:
Andy likes to drive auto.
Mary don't like to drive car.
Bob is going to buy automobile.
-------------------------------------
query: automobile
result:
Andy likes to drive auto.
Mary don't like to drive car.
Bob is going to buy automobile.
我知道斯芬克斯有stowords,但我应该在stopwords字典中输入什么让斯芬克斯这样想呢


谢谢。

您所要做的就是在.conf文件中为sphinx提供一个格式正确的wordforms文本文件

文件可在此处找到:


让我举一个词形词法的例子,其中包含“杠杆”和“杠杆”两个词,因为这两个词在金融领域是相等的,应该被视为同义词(这两个词的含义都是“金融杠杆”)

最初,您的“wordforms.txt”文件应该包含如下所列的内容:

gear > gear
geared > gear
gearing > gear
gears > gear
……
leverage > leverage
leveraged > leverage
leverages > leverage
leveraging > leverage
这意味着这两个词本来是没有联系的。为了解决这个问题,您应该通过以下方式修改“wordforms.txt”的内容:

gear > leverage
geared > leverage
gearing > leverage
gears > leverage
……
leveraged > leverage
leverages > leverage
leveraging > leverage
此编辑将它们(及其所有表单)连接起来。编辑“wordforms.txt”文件后,必须将其保存并重新索引索引,以便应用更改


现在,当你搜索“杠杆效应”或“杠杆效应”时,你的搜索结果将包含这两个词以及它们的所有形态。

是的,我已经查阅了关于词形态的手册。但我不明白我该怎么做才能把这些词等同起来。我应该把汽车>汽车,汽车>汽车,汽车>汽车,汽车>汽车,汽车>汽车,汽车>汽车,汽车>汽车吗?还是其他不那么复杂的方式?谢谢。语法是[考虑这个词]>[作为这个词]。正如我试图在示例代码中演示的那样,您希望使用car作为其他每个单词的形式,以便它们都等效于sphinx。记住词干分析并不是在单词形式上执行的,所以复数和复数必须被明确地指定。我在上问了同样的问题,你同时也回答了。:)小观察。。。我想你的意思是把‘玛丽不喜欢开车’作为‘汽车’查询的第一个结果。
gear > leverage
geared > leverage
gearing > leverage
gears > leverage
……
leveraged > leverage
leverages > leverage
leveraging > leverage