String 比较字符串的相似性?

String 比较字符串的相似性?,string,algorithm,list,graph,distance,String,Algorithm,List,Graph,Distance,我想数一数,在数千条条目的列表中,某个大学课程出现的次数。问题是这门课的拼写并不总是一样的。例如,计算机工程可以拼写为计算机工程。什么是测试两个字符串是否非常相似的合适、优雅的方法?我会尝试使用将字符串规范化。这个想法是——给每个字符串指定其规范形式,两个不同的字符串,代表相同的单词,很可能具有相同的规范形式(例如,Computer和Computers将具有相同的规范形式,您将获得匹配) 通常用于封圣 另一种方法是根据字符串之间的距离对字符串进行分级,建议的方法可以帮助您进行分级,但就个人而言

我想数一数,在数千条条目的列表中,某个大学课程出现的次数。问题是这门课的拼写并不总是一样的。例如,
计算机工程
可以拼写为
计算机工程
。什么是测试两个字符串是否非常相似的合适、优雅的方法?

我会尝试使用将字符串规范化。这个想法是——给每个字符串指定其规范形式,两个不同的字符串,代表相同的单词,很可能具有相同的规范形式(例如,
Computer
Computers
将具有相同的规范形式,您将获得匹配)

通常用于封圣



另一种方法是根据字符串之间的距离对字符串进行分级,建议的方法可以帮助您进行分级,但就个人而言,我更喜欢规范化。

我使用了Jaro Winkler distance,我通过谷歌搜索Levenshtein distance找到了它,结果非常好。