Python 3.x 保存的sklearn模型与经过训练的模型预测结果不同_Python 3.x_Machine Learning_Scikit Learn_Random Forest

Python 3.x 保存的sklearn模型与经过训练的模型预测结果不同

python-3.x machine-learning scikit-learn

Python 3.x 保存的sklearn模型与经过训练的模型预测结果不同,python-3.x,machine-learning,scikit-learn,random-forest,Python 3.x,Machine Learning,Scikit Learn,Random Forest,我在sklearn中培训了简单随机回归器： from sklearn.ensemble import RandomForestRegressor ran_for = RandomForestRegressor(n_estimators = 300, min_samples_split = 2, random_state = RND, n_jobs = 20, max_depth = 8, verbose = 2) ran_for.fit(X_c, y_c) 然后我通过joblib保存

我在sklearn中培训了简单随机回归器：

from sklearn.ensemble import RandomForestRegressor

ran_for = RandomForestRegressor(n_estimators = 300, min_samples_split = 2, 
   random_state = RND, n_jobs = 20, max_depth = 8, verbose = 2)
ran_for.fit(X_c, y_c)

然后我通过joblib保存了模型：

from joblib import dump

dump(ran_for, '/content/random_forest_regressor.joblib')

之后，我重新启动内核，并加载先前保存的模型：

from joblib import load

my_model = load('/content/random_forest_regressor.joblib')

我在同一数据集中的样本上测试了保存的模型：

pred = my_model.predict(X_test)

看起来我保存的模型工作完全错误，以下是预测的唯一值和baplot：

print(pd.Series(pred).unique())
plt.figure(figsize = (10, 10))
pd.Series(pred).hist()
plt.show()

[892.52446705599.29566532539.45592338903.7438715601.12144516]

我做错了吗

我在谷歌Colab上运行这个

编辑：正如评论中所建议的，这里是保存前的模型预测：

pred = ran_for.predict(X_test)
print(pred[:20])
plt.figure(figsize = (10, 10))
pd.Series(pred).hist(bins = 1000).set_xlim([0, 5000])
plt.show()

在这里，你可以看到，该模型正确地预测了数值。

结果表明，这是谷歌Colab的问题。在我的本地机器上尝试了相同的方法-效果很好。

在保存和重新加载之前，您需要向我们显示预测，以证明这实际上是不同的。谢谢，我编辑了这个问题