Python中文本数据的核心、精度、召回率和准确性

Python中文本数据的核心、精度、召回率和准确性,python,nltk,precision,text-classification,precision-recall,Python,Nltk,Precision,Text Classification,Precision Recall,我不知道如何用Python计算Fscore、精度、召回率和准确度。我有一个excel文件,有“1172行x 3列”。其中第1列包含原始单词,第2列包含Gold引理,第3列包含测试引理 如何在Python中计算Fscore、精度、召回率和准确度。我用的是Jupytor 我的数据是UTF-8格式的,语言是乌尔都语难道你不能用Python比较第2列和第3列(比较每个对应单元格中的字符串)来得出你的分数吗?因为没有分类器,我不知道如何定义精度和召回率,你能详细说明一下吗?精度为真阳性/(真阳性+假阳性

我不知道如何用Python计算Fscore、精度、召回率和准确度。我有一个excel文件,有“1172行x 3列”。其中第1列包含原始单词,第2列包含Gold引理,第3列包含测试引理

如何在Python中计算Fscore、精度、召回率和准确度。我用的是Jupytor
我的数据是UTF-8格式的,语言是乌尔都语

难道你不能用Python比较第2列和第3列(比较每个对应单元格中的字符串)来得出你的分数吗?因为没有分类器,我不知道如何定义精度和召回率,你能详细说明一下吗?精度为真阳性/(真阳性+假阳性)。在你的语境中,什么是假阳性还是假阴性?@picmate实际上我很困惑。我不知道解决办法。但我至少要计算一下fscores。但我不知道如何比较和计算。没有TP和FP。你能告诉我如何找到fscore吗?不确定你是在寻找F1还是Fbeta。但是,这是定义:。基本上,你要计算准确度和召回率,然后从中计算F分数。我将尝试为您的示例制定一个解决方案,因为没有误报或漏报,精确度和召回率将为1。那么F1的比分又是1。但是,精确度将有所不同。准确度是正确预测/所有预测的数量。这将是第2列和第3列中匹配的字母除以第2列中的所有字母。