Python 模糊模糊字符串匹配-区分大小写

Python 模糊模糊字符串匹配-区分大小写,python,case-insensitive,fuzzy-search,fuzzywuzzy,Python,Case Insensitive,Fuzzy Search,Fuzzywuzzy,我在用电话 我发现,当使用token_set_ratio搜索算法时,大小写之间的微小差异会产生截然不同的结果 例如,如果我在文件中查找短语“我在吃”,我会得到100%的匹配。但是如果这个短语是“我在吃”,只要一个字母的大小写上一个变化,我就能得到65%的匹配 有没有办法使算法不区分大小写?默认情况下,token\u set\u ratio()不区分大小写 from fuzzywuzzy import fuzz fuzz.token_set_ratio("I am eating", "i am e

我在用电话

我发现,当使用token_set_ratio搜索算法时,大小写之间的微小差异会产生截然不同的结果

例如,如果我在文件中查找短语“我在吃”,我会得到100%的匹配。但是如果这个短语是“我在吃”,只要一个字母的大小写上一个变化,我就能得到65%的匹配

有没有办法使算法不区分大小写?

默认情况下,token\u set\u ratio()不区分大小写

from fuzzywuzzy import fuzz
fuzz.token_set_ratio("I am eating", "i am eating")
=> 100

如果查看
fuzz
的原始代码,您会发现
fuzz.token\u set\u ratio
在进行序列匹配之前将字符串转换为小写

此外,您可能希望从SeatGeek工程师处查看此stackoverflow帖子,以便更好地了解比率使用情况


希望这有帮助

我也有同样的问题,你可能使用了Ratio而不是TokenSetRatio…

你可以在所有东西上都使用
.upper
?为什么这个答案是-1?就我所见,它说的是事实——默认情况下它不区分大小写(kwarg token_process=False会区分大小写)@Sarunaazna我只能对谁做了-1进行推定,但答案表明它区分大小写,而不是不区分大小写。除了区分大小写之外,token_set_比率还有其他区别。