Python 分解为列车和测试时,获取H2O数据帧的行索引

Python 分解为列车和测试时,获取H2O数据帧的行索引,python,dataframe,indexing,h2o,Python,Dataframe,Indexing,H2o,我是H2O新手。到目前为止,对于列车测试拆分,我使用了sklearn的StratifiedKFold() skf = StratifiedKFold(n_splits=n, random_state=None, shuffle=False) for train_index, test_index in skf.split(X, y): X_train, X_test = X[train_index], X[test_index] y_train, y

我是H2O新手。到目前为止,对于列车测试拆分,我使用了sklearn的StratifiedKFold()

skf = StratifiedKFold(n_splits=n, random_state=None, shuffle=False)
for train_index, test_index in skf.split(X, y):               
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]
我需要索引以便稍后进行进一步处理

在H2O中,我不知道如何在进行交叉验证时获取索引。从我通过视频和博客收集的信息来看,我们是如何在H2O中进行CV的:

gbm_model = H2OGradientBoostingEstimator(model_id = 'gbm_model',nfolds=5)
如何获得每个折叠的训练和测试指标

另外,在进行简单拆分时,如何获取索引

data_split = data.split_frame(ratios=[0.8],seed = 1234)
train_df = data_split[0]
test_df = data_split[1]

如何获得进入训练和测试的索引?

您可以使用
分层折叠列(n\u folds=3,seed=-1)
分层分割(test\u frac=0.2,seed=-1)
创建一个列,其中包含可用于稍后分割的子集的分割

有关这些的更多信息,请参见