编辑距离相似性sas?
我在V_tablas.arreglo(columns-->domainsBad)表中有一个域列表:编辑距离相似性sas?,sas,Sas,我在V_tablas.arreglo(columns-->domainsBad)表中有一个域列表: @hotmai.es @ghotmail.es @hotmaol.com @hotmai.com @otmail.com…..等(超过10k) 并需要将此域更正为“@hotmail.com” 我的问题是关于oracle for get的编辑距离相似性(模糊逻辑)“返回一个介于0和100之间的整数,其中0表示完全不相似,100表示完全匹配”是否可行?您可以使用Levenshtein距离算法()计算出
@hotmai.es
@ghotmail.es
@hotmaol.com
@hotmai.com
@otmail.com…..等(超过10k)
并需要将此域更正为“@hotmail.com”
我的问题是关于oracle for get的编辑距离相似性(模糊逻辑)“返回一个介于0和100之间的整数,其中0表示完全不相似,100表示完全匹配”是否可行?您可以使用Levenshtein距离算法()计算出将源字符串转换为目标字符串的编辑次数 以下回答中描述了SQL中的一个实现:
SAS至少有两个函数用于计算两个字符串之间的编辑距离: comped,对于一般编辑距离: Complev,对于Levenshtein距离: 也不要忘记
SPEDIS()
。