Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/neo4j/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/iphone/43.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
编辑距离相似性sas?_Sas - Fatal编程技术网

编辑距离相似性sas?

编辑距离相似性sas?,sas,Sas,我在V_tablas.arreglo(columns-->domainsBad)表中有一个域列表: @hotmai.es @ghotmail.es @hotmaol.com @hotmai.com @otmail.com…..等(超过10k) 并需要将此域更正为“@hotmail.com” 我的问题是关于oracle for get的编辑距离相似性(模糊逻辑)“返回一个介于0和100之间的整数,其中0表示完全不相似,100表示完全匹配”是否可行?您可以使用Levenshtein距离算法()计算出

我在V_tablas.arreglo(columns-->domainsBad)表中有一个域列表:
@hotmai.es
@ghotmail.es
@hotmaol.com
@hotmai.com
@otmail.com…..等(超过10k)
并需要将此域更正为“@hotmail.com”
我的问题是关于oracle for get的编辑距离相似性(模糊逻辑)“返回一个介于0和100之间的整数,其中0表示完全不相似,100表示完全匹配”是否可行?

您可以使用Levenshtein距离算法()计算出将源字符串转换为目标字符串的编辑次数

以下回答中描述了SQL中的一个实现:


SAS至少有两个函数用于计算两个字符串之间的编辑距离:

comped,对于一般编辑距离:

Complev,对于Levenshtein距离:

也不要忘记
SPEDIS()