Python 模糊模糊字符串匹配-区分大小写_Python_Case Insensitive_Fuzzy Search_Fuzzywuzzy

Python 模糊模糊字符串匹配-区分大小写

python

Python 模糊模糊字符串匹配-区分大小写,python,case-insensitive,fuzzy-search,fuzzywuzzy,Python,Case Insensitive,Fuzzy Search,Fuzzywuzzy,我在用电话我发现，当使用token_set_ratio搜索算法时，大小写之间的微小差异会产生截然不同的结果例如，如果我在文件中查找短语“我在吃”，我会得到100%的匹配。但是如果这个短语是“我在吃”，只要一个字母的大小写上一个变化，我就能得到65%的匹配有没有办法使算法不区分大小写？默认情况下，token\u set\u ratio（）不区分大小写 from fuzzywuzzy import fuzz fuzz.token_set_ratio("I am eating", "i am e

我在用电话

我发现，当使用token_set_ratio搜索算法时，大小写之间的微小差异会产生截然不同的结果

例如，如果我在文件中查找短语“我在吃”，我会得到100%的匹配。但是如果这个短语是“我在吃”，只要一个字母的大小写上一个变化，我就能得到65%的匹配

有没有办法使算法不区分大小写？

默认情况下，token\u set\u ratio（）不区分大小写

from fuzzywuzzy import fuzz
fuzz.token_set_ratio("I am eating", "i am eating")
=> 100

如果查看

fuzz

的原始代码，您会发现

fuzz.token\u set\u ratio

在进行序列匹配之前将字符串转换为小写

此外，您可能希望从SeatGeek工程师处查看此stackoverflow帖子，以便更好地了解比率使用情况

希望这有帮助

我也有同样的问题，你可能使用了Ratio而不是TokenSetRatio…

你可以在所有东西上都使用

.upper

？为什么这个答案是-1？就我所见，它说的是事实——默认情况下它不区分大小写（kwarg token_process=False会区分大小写）@Sarunaazna我只能对谁做了-1进行推定，但答案表明它区分大小写，而不是不区分大小写。除了区分大小写之外，token_set_比率还有其他区别。