Teradata SQL基于近似字符串匹配提取记录_Teradata_Levenshtein Distance_Fuzzy_Metaphone

Teradata SQL基于近似字符串匹配提取记录

teradata

Teradata SQL基于近似字符串匹配提取记录,teradata,levenshtein-distance,fuzzy,metaphone,Teradata,Levenshtein Distance,Fuzzy,Metaphone,我们使用的是TD 14版本，我来自Netezza/Postgre（红移）背景。我被要求从审计日志中提取一个登录数据，以找出同一ip提交的用户名外观相似但变化不大的记录/事务。e、 g Samir-->Samr-->Amir等捕获网络钓鱼活动。在POstgres中，我们有像“%”这样的模糊字符串函数，例如ColA%ColB（其中%运算符相当于类似的运算符） Soundex、变音电话、levenshtein等。然而，在Teradata中，我刚刚遇到过或者只能找到Soundex。Teradata

我们使用的是TD 14版本，我来自Netezza/Postgre（红移）背景。我被要求从审计日志中提取一个登录数据，以找出同一ip提交的用户名外观相似但变化不大的记录/事务。e、 g Samir-->Samr-->Amir等捕获网络钓鱼活动。在POstgres中，我们有像“%”这样的模糊字符串函数，例如ColA%ColB（其中%运算符相当于类似的运算符） Soundex、变音电话、levenshtein等。

然而，在Teradata中，我刚刚遇到过或者只能找到Soundex。Teradata版本14是否具有任何此类内置函数/方法功能，以实现上述字符串近似。

Teradata 14.x通过

EDITDISTANCE（）

函数支持Damerau-Levenshtein距离算法，并通过

NGRAM（）

函数支持n-gram模式匹配

您可以找到有关EDITDISTANCE函数和NGRAM（）函数的信息