Python sklearn SGDClassizer,在没有匹配项时生成标签?

Python sklearn SGDClassizer,在没有匹配项时生成标签?,python,python-3.x,scikit-learn,classification,Python,Python 3.x,Scikit Learn,Classification,我正在使用sklearn SGDClassizer预测我的数据集。 我的文本不应该被分类在任何标签/类别中,但我很惊讶,如果我将测试数据作为“kjhd askdhajksdh asd askh”,它仍然被分类到给定的类别之一 我也研究过概率,但对于这篇垃圾文本,仍然有一个有价值的概率 我的问题是,对于这种情况,分类器是否可以返回“未找到匹配项”等信息?否。分类器将以最高的概率对训练中某个标签的任何输入进行分类,无论这些概率有多小 可以使用设置标签的阈值。 比如: threshold = 0.25

我正在使用sklearn SGDClassizer预测我的数据集。 我的文本不应该被分类在任何标签/类别中,但我很惊讶,如果我将测试数据作为“kjhd askdhajksdh asd askh”,它仍然被分类到给定的类别之一

我也研究过概率,但对于这篇垃圾文本,仍然有一个有价值的概率


我的问题是,对于这种情况,分类器是否可以返回“未找到匹配项”等信息?

否。分类器将以最高的概率对训练中某个标签的任何输入进行分类,无论这些概率有多小

可以使用设置标签的阈值。 比如:

threshold = 0.25
if confidence_score < threshold:
    print("No match found")
阈值=0.25
如果置信度得分<阈值:
打印(“未找到匹配项”)