Teradata SQL基于近似字符串匹配提取记录

Teradata SQL基于近似字符串匹配提取记录,teradata,levenshtein-distance,fuzzy,metaphone,Teradata,Levenshtein Distance,Fuzzy,Metaphone,我们使用的是TD 14版本,我来自Netezza/Postgre(红移)背景。我被要求从审计日志中提取一个登录数据,以找出同一ip提交的用户名外观相似但变化不大的记录/事务。e、 g Samir-->Samr-->Amir等 捕获网络钓鱼活动。 在POstgres中,我们有像“%”这样的模糊字符串函数,例如ColA%ColB(其中%运算符相当于类似的运算符) Soundex、变音电话、levenshtein等。 然而,在Teradata中,我刚刚遇到过或者只能找到Soundex。Teradata

我们使用的是TD 14版本,我来自Netezza/Postgre(红移)背景。我被要求从审计日志中提取一个登录数据,以找出同一ip提交的用户名外观相似但变化不大的记录/事务。e、 g Samir-->Samr-->Amir等 捕获网络钓鱼活动。 在POstgres中,我们有像“%”这样的模糊字符串函数,例如ColA%ColB(其中%运算符相当于类似的运算符) Soundex、变音电话、levenshtein等。
然而,在Teradata中,我刚刚遇到过或者只能找到Soundex。Teradata版本14是否具有任何此类内置函数/方法功能,以实现上述字符串近似。

Teradata 14.x通过
EDITDISTANCE()
函数支持Damerau-Levenshtein距离算法,并通过
NGRAM()
函数支持n-gram模式匹配

您可以找到有关EDITDISTANCE函数和NGRAM()函数的信息