Nlp 拼写纠正模型的一些评估是什么?
我一直在研究拼写纠正模型,并试图找到一些评估指标。如果你认为假阴性试图修复一个已经正确的单词和错误的正误,那么你就可以计算精度、回忆和准确度。但是,这些指标并没有说明更正模型的质量(无论它是否成功地将错误的单词更正为用户想要键入的单词),只评估拼写检查功能,而不是更正功能 在许多语言中,最困难的部分是在许多候选语言中选择正确的替代者。例如,Nlp 拼写纠正模型的一些评估是什么?,nlp,spell-checking,spelling,misspelling,Nlp,Spell Checking,Spelling,Misspelling,我一直在研究拼写纠正模型,并试图找到一些评估指标。如果你认为假阴性试图修复一个已经正确的单词和错误的正误,那么你就可以计算精度、回忆和准确度。但是,这些指标并没有说明更正模型的质量(无论它是否成功地将错误的单词更正为用户想要键入的单词),只评估拼写检查功能,而不是更正功能 在许多语言中,最困难的部分是在许多候选语言中选择正确的替代者。例如,lck应该是lock,lick,lock,ick,还是luck?(当然,断章取义,你说不出来!) 因此,您要寻找的指标是准确更正的数量。您没有尝试修复的错误,
lck
应该是lock
,lick
,lock
,ick
,还是luck
?(当然,断章取义,你说不出来!)
因此,您要寻找的指标是准确更正的数量。您没有尝试修复的错误,以及您错误地替换的正确单词将被您发现但未准确更正的错误淹没,尽管您可能仍希望分别统计这些情况
如果您的修正候选排序算法是独立的,您可以通过单独评估来显著地调整流程。这样我就可以测量成功修正的错误百分比?我会将什么指定为假阴性和假阳性来衡量纠正的质量?假阴性和假阳性在这里并没有多大意义;它们是分类度量,而不是校正度量。快速的谷歌搜索出现了,但我不能马上判断这是否有用。(我注意到他们的摘要中有一个标点符号错误,tee-hee。)如果你想将其压缩到FP/FN模型中,可能会将系统没有试图纠正的错误视为假阴性,而将没有产生正确结果的任何纠正视为假阳性。因此,真正的否定词是拼写正确的单词,没有改变;真正的肯定词是成功的更正。(这颠倒了“积极”和“消极”的含义,但这对我来说更有意义。)我想我可以把它放在FP/FN模型中,但我觉得这样做会产生不太能代表校正器的结果。也许要对拼写错误的单词进行整体准确度和准确度的校正?从长远来看,一个数字或一对数字可能没有用处,特别是如果它们不是标准的衡量标准。分为错误检测的准确性和校正候选生成的准确性可能是未来的方向。