Sql 呼叫中心文本中子字符串匹配的置信度

Sql 呼叫中心文本中子字符串匹配的置信度,sql,sql-server,r,Sql,Sql Server,R,我们正在尝试清除呼叫中心记录,其中有呼叫中心代理输入的自由文本,但没有为文本分配产品。我们希望将免费文本与产品列表进行比较,并在该列表中找到最匹配的产品 我在R中尝试了STRINGDIST包,虽然我可以得到一个带有结果的矩阵,但距离值并不是我所期望的 例如: "I was told by a salesperson that the foundation light contains a small amount of SPF. Is this true?" PRODUCT NAMES: F

我们正在尝试清除呼叫中心记录,其中有呼叫中心代理输入的自由文本,但没有为文本分配产品。我们希望将免费文本与产品列表进行比较,并在该列表中找到最匹配的产品

我在R中尝试了
STRINGDIST
包,虽然我可以得到一个带有结果的矩阵,但距离值并不是我所期望的

例如:

"I was told by a salesperson that the foundation light contains a small amount of SPF. Is this true?"

PRODUCT NAMES:

FDN LGHT
FOUNDATION LIGHT
LIPSTICK
LIGHT LIPSTICK
我希望结果是“基础之光”得分最高,然后是剩余项目的后续排名,“口红”没有得分,因为没有比赛


请注意,如果您认为这可以用另一种语言完成,我将乐意接受任何建议

你看过Levenshtein距离算法吗?这是一个TSQL版本,你看过Levenshtein距离算法吗?这是一个TSQL版本