Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/303.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
开发一个python/pyspark程序来显示类似类型的单词_Python_Algorithm_Machine Learning_Pyspark_Fuzzy Logic - Fatal编程技术网

开发一个python/pyspark程序来显示类似类型的单词

开发一个python/pyspark程序来显示类似类型的单词,python,algorithm,machine-learning,pyspark,fuzzy-logic,Python,Algorithm,Machine Learning,Pyspark,Fuzzy Logic,[代码\u图像 它应该以一列打印类似的输出 ]> 输出: 比率清单: [apple',100',appple',91',apple',91',apple-apple',90',aple',89] 以上列表中最好的--->“苹果”,100 我只需要更改一行代码,然后在您的代码片段中添加另一行。 您可以在我应用这些更改的地方找到注释,这些注释解释了这些更改的作用。我不确定您想要的确切输出格式,所以请随时再次询问是否不是您想要的格式 如果您想更深入地了解最后一行的工作原理,请查看 从fuzzyfuzz

[代码\u图像

它应该以一列打印类似的输出 ]>

输出:

比率清单:

[apple',100',appple',91',apple',91',apple-apple',90',aple',89]

以上列表中最好的--->“苹果”,100


我只需要更改一行代码,然后在您的代码片段中添加另一行。 您可以在我应用这些更改的地方找到注释,这些注释解释了这些更改的作用。我不确定您想要的确切输出格式,所以请随时再次询问是否不是您想要的格式

如果您想更深入地了解最后一行的工作原理,请查看

从fuzzyfuzzy导入fuzz 从模糊导入过程 query=Apple 一套数据记录 选项=[apil, 苹果 阿皮尔, aple, 阿皮尔, 阿普尔, 苹果, 芹菜橙, 苹果 ] 第一次在这里换钱 下一行存储每个选项的元组以及列表中的相似性度量。这些条目似乎是按照代码段显示的顺序排列的。 有序的_选项=process.extractquery,选项 印刷精度值 打印比率列表: 打印process.extractquery,选项,\n process.extractonequery,选项 打印\n上面列表中的列表--->,process.extractOnequery,choices 第二次在这里换钱 下一行获取列表中每个元组的第一个元素,并将is添加到另一个列表中,然后打印该列表。 打印\n已排序的选项:,[choice for choice,value in ordered_choices]
嗨,刺客,欢迎来到StackOverflow!你能告诉我们,到目前为止你都试了些什么吗?你也可以考虑阅读如何提问。遵循这些指导原则几乎肯定会增加您获得答案的机会。pyspark或python程序可以匹配类似类型的单词,并且应该以表格格式显示,如。。相似的单词拼写不同,就像苹果和苹果一样。这些单词应该以表格格式查看。到目前为止,您是否自己编写了代码?如果是这样,请与我们分享,我相信你会得到帮助。如果没有,不要期望社区为你做家庭作业,因为这不是StackOverflow的目的。你应该先表现出你自己的努力!我上传了一张包含我代码的图片。我只需要以表格的形式显示答案……谢谢@jofrev它成功了。。。。。
from fuzzywuzzy import fuzz
from fuzzywuzzy import process
query = "Apple"
#set of DATA 25 records
choices = ["apil",
    "apple",
    "Apille",
    "aple",
    "apil",
    "appple",
    "Apple APPLE",
    "Apil Orange",
    "apples"
]
process.extract(query, choices)
#### Printing Accuracy Value
print ("List of ratios: ")
print (process.extract(query, choices), "\n")
#process.extractone(query, choices)
print ("\nBest among the above list ----->",process.extractOne(query, choices))