Python sklearn SGDClassizer,在没有匹配项时生成标签?
我正在使用sklearn SGDClassizer预测我的数据集。 我的文本不应该被分类在任何标签/类别中,但我很惊讶,如果我将测试数据作为“kjhd askdhajksdh asd askh”,它仍然被分类到给定的类别之一 我也研究过概率,但对于这篇垃圾文本,仍然有一个有价值的概率Python sklearn SGDClassizer,在没有匹配项时生成标签?,python,python-3.x,scikit-learn,classification,Python,Python 3.x,Scikit Learn,Classification,我正在使用sklearn SGDClassizer预测我的数据集。 我的文本不应该被分类在任何标签/类别中,但我很惊讶,如果我将测试数据作为“kjhd askdhajksdh asd askh”,它仍然被分类到给定的类别之一 我也研究过概率,但对于这篇垃圾文本,仍然有一个有价值的概率 我的问题是,对于这种情况,分类器是否可以返回“未找到匹配项”等信息?否。分类器将以最高的概率对训练中某个标签的任何输入进行分类,无论这些概率有多小 可以使用设置标签的阈值。 比如: threshold = 0.25
我的问题是,对于这种情况,分类器是否可以返回“未找到匹配项”等信息?否。分类器将以最高的概率对训练中某个标签的任何输入进行分类,无论这些概率有多小 可以使用设置标签的阈值。 比如:
threshold = 0.25
if confidence_score < threshold:
print("No match found")
阈值=0.25
如果置信度得分<阈值:
打印(“未找到匹配项”)