Machine learning 分层分流列车/试验-H2O

Machine learning 分层分流列车/试验-H2O,machine-learning,h2o,Machine Learning,H2o,我使用H2O来构建和比较模型,但我想知道是否有一种功能允许我将数据分割为训练和分层测试 我知道交叉验证存在选项fold_赋值,我使用它 我的问题更多的是数据的操作,以及在构建任何模型之前何时需要拆分数据 我对此进行了研究,但它没有指定是否对分类进行分层拆分 可能对于分类问题,它是隐式的,并且始终实现分层拆分?将数据拆分为训练/测试/验证,训练各占70%,测试和验证各占15% train,test,valid = prostate_df.split_frame(ratios=(.7, .15))

我使用H2O来构建和比较模型,但我想知道是否有一种功能允许我将数据分割为训练和分层测试

我知道交叉验证存在选项fold_赋值,我使用它

我的问题更多的是数据的操作,以及在构建任何模型之前何时需要拆分数据

我对此进行了研究,但它没有指定是否对分类进行分层拆分


可能对于分类问题,它是隐式的,并且始终实现分层拆分?

将数据拆分为训练/测试/验证,训练各占70%,测试和验证各占15%

train,test,valid = prostate_df.split_frame(ratios=(.7, .15))

将数据分为培训/测试/验证,培训占70%,测试和验证各占15%

train,test,valid = prostate_df.split_frame(ratios=(.7, .15))