Python 混淆矩阵精度评估非等长用户和生产者数据集_Python_Pandas_Classification_Confusion Matrix

Python 混淆矩阵精度评估非等长用户和生产者数据集

python pandas

Python 混淆矩阵精度评估非等长用户和生产者数据集,python,pandas,classification,confusion-matrix,Python,Pandas,Classification,Confusion Matrix,我正在尝试执行以下分类评估：我的问题是，我的分类有300多万个分类像素，而我的训练数据集只有大约30-40个（可以说明的每个类有10-15个）我的两个数据集的布局如下所示：训练行示例=[[230,40120,2]]和前三个值为像素色带（BGR），最终为规定色带输出类（我们可以1-3）我正在以csv文件的形式读取训练数据，并将其转换为熊猫数据帧问题：即使我在两个数据集中有不同数量的预测和实际数据值，是否可以使用这种方法？如果是这样，则不确定第9行到第13行的用途代码：你的问题是什

我正在尝试执行以下分类评估：

我的问题是，我的分类有300多万个分类像素，而我的训练数据集只有大约30-40个（可以说明的每个类有10-15个）

我的两个数据集的布局如下所示：

训练行示例=[[230,40120,2]]和前三个值为像素色带（BGR），最终为规定色带输出类（我们可以1-3）

我正在以csv文件的形式读取训练数据，并将其转换为熊猫数据帧

问题：即使我在两个数据集中有不同数量的预测和实际数据值，是否可以使用这种方法？如果是这样，则不确定第9行到第13行的用途

代码：

你的问题是什么？@mad_uu更新了这个问题谢谢你的提醒首先，不要发布图片。第9-13行将您的功能和目标值分离。test_size将是一个参数，用于分割测试和训练数据集中的值。

b,g,r = cv2.split(img)
# Pandas dataset
dataSet = pd.DataFrame({'bBnad':b.flat[:],'gBnad':g.flat[:],'rBnad':r.flat[:]})
dataSet['class'] = X_clustered
training = pd.read_csv("/Users/chrisradford/Documents/School/Masters/RA/Classifier/Python/Training.csv")