停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题_H2o

停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题

停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题,h2o,H2o,在阅读h2o文档后，我仍然有以下问题让我感到困惑。有人能给我解释一下吗对于停止_公差=0.001，让我们使用AUC，例如，当前AUC为0.8。这是否意味着AUC需要增加0.8+0.001或需要增加0.8*（1+0.1%）在H2O文档中对每个迭代进行评分（）它只是说“迭代”。但每一个的确切定义是什么 “迭代”，是指每个树或每个网格搜索或每个K文件夹交叉验证还是其他什么我可以定义得分树间隔并将每次迭代的得分设置为True吗同时，或者我只能使用其中一个来制作网格搜索可重复 “停止度量”有

在阅读h2o文档后，我仍然有以下问题让我感到困惑。有人能给我解释一下吗

对于停止_公差=0.001，让我们使用AUC，例如，当前AUC为0.8。这是否意味着AUC需要增加0.8+0.001或需要增加0.8*（1+0.1%）

在H2O文档中对每个迭代进行评分（）它只是说“迭代”。但每一个的确切定义是什么 “迭代”，是指每个树或每个网格搜索或每个K文件夹交叉验证还是其他什么

我可以定义得分树间隔并将每次迭代的得分设置为True吗同时，或者我只能使用其中一个来制作网格搜索可重复

“停止度量”有什么区别吗， “停止公差”，“停止轮数”输入 H2OGradientBoostingEstimator与H2OGridSearch的搜索条件？我发现放入GradientBoostingEstimator将使代码运行在Spark环境中进行测试时速度要快得多

0.001与0.1%相同，因为AUC越大越好，在指定的得分轮数之后，您希望看到至少0.001的增加

您已链接到文档的一部分，该部分特定于页面顶部的

中列出的算法。所以，让我们坚持回答这个关于单个模型的问题，而不是网格搜索。如果您想查看每次迭代的评分，请查看Flow中的模型结果，或者使用my_model.plot（）（对于python api）查看每次迭代的评分。对于GBM和DRF来说，这将是一个不确定因素，但由于不同的算法会有不同的方面，因此会使用迭代这个词，因为它更通用


你测试过了吗？你做这件事的时候发现了什么？查看flow中的评分历史图，并注意当您同时设置score_tree_interval和score_each_iteration=True时与仅设置score_tree_interval时会发生什么情况（我建议在使用网格搜索之前尝试在单个模型级别了解这些参数）
是的，在一次情况下，您在构建单个模型时指定提前停止。在网格搜索的情况下，您指示是否启用以构建更多模型
对于问题1，如果当前AUC为0.8，停止_公差=0.001需要AUC增加到0.8*（1+0.1%），而不是0.8+0.001？对于问题3，我使用随机林进行测试，我发现a）如果我指定每次_迭代的分数=真，它将运行得更快。b） 每次迭代指定分数的结果与指定两者相同，但不同于仅指定分数树间隔=5。c） 当我运行网格搜索时，我需要指定score\u each\u iteration=True，并设置score\u tree\u interval=5以使其可重复。我不知道为什么