Python 多类分类的概率阈值

Python 多类分类的概率阈值,python,random-forest,multiclass-classification,Python,Random Forest,Multiclass Classification,我使用Python中的随机林将数据分为6个类。我的数据是X,Y,Z坐标,一些几何特征和标签。我使用几何特征和标签来训练分类器,使用训练集(随机70%的数据)。不过,我想在测试集上使用50%的概率阈值(其余30%的数据),因此,概率小于50%的预测数据被分配给第6类,表示未知,其余的数据通常为0到5。但是,我希望输出预测标签的顺序与测试集中的顺序相同,这样我就可以轻松地将预测标签与XYZ坐标关联起来,以便可视化。我怎样才能在Python中实现它呢?如果我理解正确的话;如果您的五个类中没有一个的概率

我使用Python中的随机林将数据分为6个类。我的数据是X,Y,Z坐标,一些几何特征和标签。我使用几何特征和标签来训练分类器,使用训练集(随机70%的数据)。不过,我想在测试集上使用50%的概率阈值(其余30%的数据),因此,概率小于50%的预测数据被分配给第6类,表示未知,其余的数据通常为0到5。但是,我希望输出预测标签的顺序与测试集中的顺序相同,这样我就可以轻松地将预测标签与XYZ坐标关联起来,以便可视化。我怎样才能在Python中实现它呢?

如果我理解正确的话;如果您的五个类中没有一个的概率大于0.5,您会将输入指定为第六个名为
unknown

您可以对RandomForest(RF)类使用
predict\u proba
方法。它给出了所有类的“概率”,例如一个样本


预测=预测概率(X检验)
#pred
#[[0.2,0.3,0.1,0.40],
#[0.8,0.1,0.05,0.05,0]]
我们将第一个指定为
未知
(类6),第二个指定为类1

然后可以在整个测试集上使用它

pred=RF.预测概率(X检验)

class=[6 if sum(p如果我理解正确;如果您的五个类中没有一个的概率>0.5,您会将输入指定为名为
unknown
的第六个类

您可以对RandomForest(RF)类使用
predict\u proba
方法。它为您的所有类(例如一个样本)提供“概率”


预测=预测概率(X检验)
#pred
#[[0.2,0.3,0.1,0.40],
#[0.8,0.1,0.05,0.05,0]]
我们将第一个指定为
未知
(类6),第二个指定为类1

然后可以在整个测试集上使用它

pred=RF.预测概率(X检验)
类=[6如果和(p