Machine learning 基于H2O的随机森林模型在转换为POJO时总是预测1_Machine Learning_Pojo_H2o

Machine learning 基于H2O的随机森林模型在转换为POJO时总是预测1

machine-learning

Machine learning 基于H2O的随机森林模型在转换为POJO时总是预测1,machine-learning,pojo,h2o,Machine Learning,Pojo,H2o,我不熟悉机器学习，使用随机森林算法对不平衡数据集进行预测。我在R中建立了模型，响应变量是一个二进制分类变量（0,1）。R中构建的随机森林模型生成了一个正确的分类，但是当该模型被转换为h2o pojo以构建应用程序时，该模型只返回“1”作为响应。[更新：在编辑OP之前编写了答案，以澄清问题仅在转换为pojo之后出现-请参阅注释] 我敢打赌，您的数据集是高度不平衡的，即您的训练集中的1比0多得多即使您在模型拟合过程中获得了很好的精度，在这种情况下，作为度量的精度是没有意义的，您应该使用精度、召回率

我不熟悉机器学习，使用随机森林算法对不平衡数据集进行预测。我在R中建立了模型，响应变量是一个二进制分类变量（0,1）。R中构建的随机森林模型生成了一个正确的分类，但是当该模型被转换为h2o pojo以构建应用程序时，该模型只返回“1”作为响应。

[更新：在编辑OP之前编写了答案，以澄清问题仅在转换为pojo之后出现-请参阅注释]

我敢打赌，您的数据集是高度不平衡的，即您的训练集中的1比0多得多

即使您在模型拟合过程中获得了很好的精度，在这种情况下，作为度量的精度是没有意义的，您应该使用精度、召回率和混淆矩阵——谷歌“类不平衡”获取更多信息

例如，如果85%的训练标签是1，那么通过将所有样本分类为1（可以说，这并不是您想要做的事情），您可以简单地（天真地）获得85%的准确率“分类器”。

在Rstudio中运行模型时，我得到了正确的预测，但是，当我在构建H2OPOJO之后运行同一个模型并在GradleBuilder上运行时，我得到了一个错误，即所有测试的类输出都是1data@VenkataKrishnan你为什么不在你的帖子中包含这些信息？