Python sklearn分类模型pickle文件的不同结果_Python_Scikit Learn_Classification_Pickle_Plotly Dash

Python sklearn分类模型pickle文件的不同结果

python scikit-learn

Python sklearn分类模型pickle文件的不同结果,python,scikit-learn,classification,pickle,plotly-dash,Python,Scikit Learn,Classification,Pickle,Plotly Dash,我正在为sklearn分类模型创建一个带有dash的仪表板。我想绘制roc曲线和一些指标来评估模型（）问题是dash不允许超过一个输出，因此我有两种解决方案：我再次生成模型（这将花费大量时间）或者使用pickle保存sklearn生成的模型。但是当我加载pickle模型时，结果与图像中显示的结果不同，例如：原始AUC（曲线下面积）=0.7，从拾取的文件=0.93。我试着用joblib做同样的事情，但问题是一样的请原谅，这是一个代码示例，因为它很长： @app.callba

我正在为sklearn分类模型创建一个带有dash的仪表板。我想绘制roc曲线和一些指标来评估模型（）

问题是dash不允许超过一个输出，因此我有两种解决方案：

我再次生成模型（这将花费大量时间）
或者使用pickle保存sklearn生成的模型。但是当我加载pickle模型时，结果与图像中显示的结果不同，例如：原始AUC（曲线下面积）=0.7，从拾取的文件=0.93。我试着用joblib做同样的事情，但问题是一样的

请原谅，这是一个代码示例，因为它很长：

    @app.callback(Output('modelReport', 'rows'),
                  [Input('report', 'n_clicks'),
                  Input('model', 'value'),])
    def modelClassifierReport (button, mod): 
        if (button ==None):
            return [{}]
        else:
 ## saving and generating models ###   
            if (mod == 'logreg'):
                Title='Logistic regression'
                logreg = LogisticRegression()
                logreg.fit(x_train,y_train)
                model=logreg
                with open("python_logreg_model.pkl", "wb") as file_handler:
                    pickle.dump(logreg, file_handler)

            elif (mod =='mlp' ):
                mlp=MLPClassifier()
                mlp=mlp.fit(x_train, y_train)
                with open("python_mlp_model.pkl", "wb") as file_handler:
                    pickle.dump(mlp, file_handler)
                model=mlp
            elif :
                .......#other models#

            ####------------###
            #### comput indicator to evaluate models ####
            ####------------###

            report=pd.DataFrame({'creteria':['Accuracy','erreur I','erreurII' ,'AUC','CV ACU','AIC','som error']})
            report['Value']=[model_score,fnr,fpr,AUC, cv_mean,AIC,RSS]
            return  report.to_dict('records')
    #####################
    @app.callback(Output('my-graph', 'figure'),
                  [Input ('roc','n_clicks'),])

    def RocPlot (button):
        if (button ==None):
            return [{}]
        else:
### loading models 
            if(mod == 'logreg'):
                with open("python_logreg_model.pkl", "rb") as file_handler:
                    model = pickle.load(file_handler)
            elif (mod=='mlp' ):
                with open("python_mlp_model.pkl", "rb") as file_handler:
                    model = pickle.load(file_handler)
            #### load other models ####
            ####------------###
            ####------------###
            fp, tp, threshold= metrics.roc_curve(y_test, model.predict_proba(x_test)[:,1])
            AUC= metrics.auc(fp, tp)
            lw = 2
            trace1 = go.Scatter(x=fp, y=tp, 
                                mode='lines', 
                                line=dict(color='darkorange', width=lw),
                                name='ROC curve (area = %0.2f)' % AUC )
            trace2 = go.Scatter(x=[0, 1], y=[0, 1], 
                                mode='lines', 
                                line=dict(color='navy', width=lw, dash='dash'),
                                showlegend=False)
            layout = go.Layout(title='Receiver operating characteristic example',
                                xaxis=dict(title='False Positive Rate'),
                                yaxis=dict(title='True Positive Rate'))
            print('plot done')
            return{ 'data': [trace1, trace2], 'layout': layout }

我如何用酸洗模型解决这个问题？还有其他方法保存sklearn模型吗？有什么建议吗

请同时说明您是如何处理数据的？你是如何进行X_训练和X_测试的？谢谢你的回复！数据集由应用程序的用户上传，

df=pd.DataFrame（tablerows）y=df[yvar]y=np.ravel（y）x=df[Features]x\u train，x\u test，y\u train，y\u test=train\u test\u split（x，y，test\u size=float（ech），stratify=y）

，

yvar

是用户选择的从属特征的列名称，

Features

是解释特征的列表，也是用户选择的。