Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/backbone.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题_H2o - Fatal编程技术网

停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题

停止公差、每次迭代评分、评分树评分间隔等的H2O文件问题,h2o,H2o,在阅读h2o文档后,我仍然有以下问题让我感到困惑。有人能给我解释一下吗 对于停止_公差=0.001,让我们使用AUC,例如,当前AUC为0.8。这是否意味着AUC需要增加0.8+0.001或需要增加0.8*(1+0.1%) 在H2O文档中对每个迭代进行评分 ()它只是说“迭代”。但每一个的确切定义是什么 “迭代”,是指每个树或每个网格搜索或每个K文件夹 交叉验证还是其他什么 我可以定义得分树间隔并将每次迭代的得分设置为True吗 同时,或者我只能使用其中一个来制作网格 搜索可重复 “停止度量”有

在阅读h2o文档后,我仍然有以下问题让我感到困惑。有人能给我解释一下吗

  • 对于停止_公差=0.001,让我们使用AUC,例如,当前AUC为0.8。这是否意味着AUC需要增加0.8+0.001或需要增加0.8*(1+0.1%)
  • 在H2O文档中对每个迭代进行评分 ()它只是说“迭代”。但每一个的确切定义是什么 “迭代”,是指每个树或每个网格搜索或每个K文件夹 交叉验证还是其他什么
  • 我可以定义得分树间隔并将每次迭代的得分设置为True吗 同时,或者我只能使用其中一个来制作网格 搜索可重复
  • “停止度量”有什么区别吗, “停止公差”,“停止轮数”输入 H2OGradientBoostingEstimator与H2OGridSearch的搜索条件? 我发现放入GradientBoostingEstimator将使代码运行 在Spark环境中进行测试时速度要快得多
  • 0.001与0.1%相同,因为AUC越大越好,在指定的得分轮数之后,您希望看到至少0.001的增加

  • 您已链接到文档的一部分,该部分特定于页面顶部的
    中列出的算法。所以,让我们坚持回答这个关于单个模型的问题,而不是网格搜索。如果您想查看每次迭代的评分,请查看Flow中的模型结果,或者使用my_model.plot()(对于python api)查看每次迭代的评分。对于GBM和DRF来说,这将是一个不确定因素,但由于不同的算法会有不同的方面,因此会使用迭代这个词,因为它更通用

  • 你测试过了吗?你做这件事的时候发现了什么?查看flow中的评分历史图,并注意当您同时设置score_tree_interval和score_each_iteration=True时与仅设置score_tree_interval时会发生什么情况(我建议在使用网格搜索之前尝试在单个模型级别了解这些参数)

  • 是的,在一次情况下,您在构建单个模型时指定提前停止。在网格搜索的情况下,您指示是否启用以构建更多模型


  • 对于问题1,如果当前AUC为0.8,停止_公差=0.001需要AUC增加到0.8*(1+0.1%),而不是0.8+0.001?对于问题3,我使用随机林进行测试,我发现a)如果我指定每次_迭代的分数=真,它将运行得更快。b) 每次迭代指定分数的结果与指定两者相同,但不同于仅指定分数树间隔=5。c) 当我运行网格搜索时,我需要指定score\u each\u iteration=True,并设置score\u tree\u interval=5以使其可重复。我不知道为什么