Machine learning 基于H2O的随机森林模型在转换为POJO时总是预测1

Machine learning 基于H2O的随机森林模型在转换为POJO时总是预测1,machine-learning,pojo,h2o,Machine Learning,Pojo,H2o,我不熟悉机器学习,使用随机森林算法对不平衡数据集进行预测。我在R中建立了模型,响应变量是一个二进制分类变量(0,1)。R中构建的随机森林模型生成了一个正确的分类,但是当该模型被转换为h2o pojo以构建应用程序时,该模型只返回“1”作为响应。[更新:在编辑OP之前编写了答案,以澄清问题仅在转换为pojo之后出现-请参阅注释] 我敢打赌,您的数据集是高度不平衡的,即您的训练集中的1比0多得多 即使您在模型拟合过程中获得了很好的精度,在这种情况下,作为度量的精度是没有意义的,您应该使用精度、召回率

我不熟悉机器学习,使用随机森林算法对不平衡数据集进行预测。我在R中建立了模型,响应变量是一个二进制分类变量(0,1)。R中构建的随机森林模型生成了一个正确的分类,但是当该模型被转换为h2o pojo以构建应用程序时,该模型只返回“1”作为响应。

[更新:在编辑OP之前编写了答案,以澄清问题仅在转换为pojo之后出现-请参阅注释]

我敢打赌,您的数据集是高度不平衡的,即您的训练集中的1比0多得多

即使您在模型拟合过程中获得了很好的精度,在这种情况下,作为度量的精度是没有意义的,您应该使用精度、召回率和混淆矩阵——谷歌“类不平衡”获取更多信息


例如,如果85%的训练标签是1,那么通过将所有样本分类为1(可以说,这并不是您想要做的事情),您可以简单地(天真地)获得85%的准确率“分类器”。

在Rstudio中运行模型时,我得到了正确的预测,但是,当我在构建H2OPOJO之后运行同一个模型并在GradleBuilder上运行时,我得到了一个错误,即所有测试的类输出都是1data@VenkataKrishnan你为什么不在你的帖子中包含这些信息?