Python 分解为列车和测试时，获取H2O数据帧的行索引_Python_Dataframe_Indexing_H2o

Python 分解为列车和测试时，获取H2O数据帧的行索引

python dataframe indexing

Python 分解为列车和测试时，获取H2O数据帧的行索引,python,dataframe,indexing,h2o,Python,Dataframe,Indexing,H2o,我是H2O新手。到目前为止，对于列车测试拆分，我使用了sklearn的StratifiedKFold（） skf = StratifiedKFold(n_splits=n, random_state=None, shuffle=False) for train_index, test_index in skf.split(X, y): X_train, X_test = X[train_index], X[test_index] y_train, y

我是H2O新手。到目前为止，对于列车测试拆分，我使用了sklearn的StratifiedKFold（）

skf = StratifiedKFold(n_splits=n, random_state=None, shuffle=False)
for train_index, test_index in skf.split(X, y):               
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

我需要索引以便稍后进行进一步处理

在H2O中，我不知道如何在进行交叉验证时获取索引。从我通过视频和博客收集的信息来看，我们是如何在H2O中进行CV的：

gbm_model = H2OGradientBoostingEstimator(model_id = 'gbm_model',nfolds=5)

如何获得每个折叠的训练和测试指标

另外，在进行简单拆分时，如何获取索引

data_split = data.split_frame(ratios=[0.8],seed = 1234)
train_df = data_split[0]
test_df = data_split[1]

如何获得进入训练和测试的索引？

您可以使用

分层折叠列（n\u folds=3，seed=-1）

或

分层分割（test\u frac=0.2，seed=-1）

创建一个列，其中包含可用于稍后分割的子集的分割

有关这些的更多信息，请参见