Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/meteor/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 python中的模糊匹配日语字符串?_Python 2.7 - Fatal编程技术网

Python 2.7 python中的模糊匹配日语字符串?

Python 2.7 python中的模糊匹配日语字符串?,python-2.7,Python 2.7,这个问题困扰了我一整天 我有两个日语字符串,我想在Python2.7中模糊匹配。目前我正在使用fuzzyfuzzy和 jpnStr = "日本語".encode('utf-8') jpnList = ["日本語1".encode('utf-8'),"日本語2".encode('utf-8'),"日本語3".encode('utf-8')] bestmatch = process.extractOne(jpnStr, jpnList) 但最终的最佳匹配总是 ("日本語1",0) 我该如何解决这

这个问题困扰了我一整天

我有两个日语字符串,我想在Python2.7中模糊匹配。目前我正在使用fuzzyfuzzy和

jpnStr = "日本語".encode('utf-8')
jpnList = ["日本語1".encode('utf-8'),"日本語2".encode('utf-8'),"日本語3".encode('utf-8')]
bestmatch = process.extractOne(jpnStr, jpnList)
但最终的最佳匹配总是

("日本語1",0)

我该如何解决这个问题,或者是否有一个我完全没有的最佳实践?抱歉,如果我听起来很沮丧,这已经是一个路障了。提前谢谢。

好的,我不确定这有多大帮助,但我已经找到了解决办法

我发现我可以用fuzzyfuzzy模糊匹配日语字符串

首先,你得到的是日本独角兽弦日本語です 然后将其作为ascii文本输出到文本文件中。输出将类似于/uf34/ufeac/uewa3/。。。诸如此类。 然后读取文本文件,并将日语字符串:/uf34/ufeac/uewa3/的ascii表示形式相互比较。这提供了一个可行的模糊匹配评级。
这可能不是一个理想的方法,但它是有效的,而且相当准确。希望这对某人有所帮助。

你为什么要通过UTF-8 ByTestRing而不是文本来传递它?事实上我不确定。它曾经给我“ascii”不在范围内的错误,所以我开始用UTF-8编码所有东西