Python 混淆矩阵精度评估非等长用户和生产者数据集

Python 混淆矩阵精度评估非等长用户和生产者数据集,python,pandas,classification,confusion-matrix,Python,Pandas,Classification,Confusion Matrix,我正在尝试执行以下分类评估: 我的问题是,我的分类有300多万个分类像素,而我的训练数据集只有大约30-40个(可以说明的每个类有10-15个) 我的两个数据集的布局如下所示: 训练行示例=[[230,40120,2]]和前三个值 为像素色带(BGR),最终为规定色带 输出类(我们可以1-3) 我正在以csv文件的形式读取训练数据,并将其转换为熊猫数据帧 问题:即使我在两个数据集中有不同数量的预测和实际数据值,是否可以使用这种方法?如果是这样,则不确定第9行到第13行的用途 代码: 你的问题是什

我正在尝试执行以下分类评估:

我的问题是,我的分类有300多万个分类像素,而我的训练数据集只有大约30-40个(可以说明的每个类有10-15个)

我的两个数据集的布局如下所示:

训练行示例=[[230,40120,2]]和前三个值 为像素色带(BGR),最终为规定色带 输出类(我们可以1-3)

我正在以csv文件的形式读取训练数据,并将其转换为熊猫数据帧

问题:即使我在两个数据集中有不同数量的预测和实际数据值,是否可以使用这种方法?如果是这样,则不确定第9行到第13行的用途

代码:


你的问题是什么?@mad_uu更新了这个问题谢谢你的提醒首先,不要发布图片。第9-13行将您的功能和目标值分离。test_size将是一个参数,用于分割测试和训练数据集中的值。
b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")