Python 在混淆矩阵中查找错误分类的数据

Python 在混淆矩阵中查找错误分类的数据,python,pandas,machine-learning,confusion-matrix,Python,Pandas,Machine Learning,Confusion Matrix,我使用这个函数来评估我的模型 def stratified_cv(X, y, clf_class, shuffle=True, n_folds=10, **kwargs): X = X.as_matrix().astype(np.float) y = y.as_matrix().astype(np.int) y_pred = y.copy() stratified_k_fold = cross_validation.StratifiedKFold(y,

我使用这个函数来评估我的模型

def stratified_cv(X, y, clf_class, shuffle=True, n_folds=10, **kwargs):

     X = X.as_matrix().astype(np.float)
     y = y.as_matrix().astype(np.int)
     y_pred = y.copy()
     stratified_k_fold = cross_validation.StratifiedKFold(y, n_folds=n_folds, shuffle=shuffle)  
     y_pred = y.copy()
     for ii, jj in stratified_k_fold:
           X_train, X_test =  X[ii],  X[jj]
           y_train,y_test = y[ii],y[jj]
           clf = clf_class(**kwargs)
           clf.fit(X_train,y_train)
           y_pred[jj] = clf.predict(X_test)
      return y_pred  
并举例给出了混淆矩阵

pass_agg_conf_matrix = metrics.confusion_matrix(y,       stratified_cv(X, y, linear_model.PassiveAggressiveClassifier))


现在我想识别错误分类的条目

您可以从混淆矩阵本身找到错误分类的预测。右上框给出了预测为0但不是零的预测数。左下框显示了预测的1,但不是1。
如果混淆矩阵是根据正确的约定建立的,则上述单元格称为真阴性和假阳性

只需在每个示例x上使用预测值clf,并找到那些y_pred不等于y的。那应该没那么难!