Python 如何在PurgedKFold中提取每个折叠的列车行和测试行?
我正在使用一个名为PurgedKFold交叉验证()的概念 我有一个数据帧,具有当前操作的打开和关闭时间间隔的open_datetime属性和close_datetime属性。我有下一个代码片段:Python 如何在PurgedKFold中提取每个折叠的列车行和测试行?,python,machine-learning,cross-validation,finance,Python,Machine Learning,Cross Validation,Finance,我正在使用一个名为PurgedKFold交叉验证()的概念 我有一个数据帧,具有当前操作的打开和关闭时间间隔的open_datetime属性和close_datetime属性。我有下一个代码片段: cv = PurgedKFold( n_splits=5, samples_info_sets=pd.Series(df['close_datetime'].values, index = df['open_datetime'].values), pct
cv = PurgedKFold(
n_splits=5,
samples_info_sets=pd.Series(df['close_datetime'].values, index = df['open_datetime'].values),
pct_embargo=0.2,
)
for a, (b, c) in enumerate(cv.split(X, y)):
...
其想法是为交叉验证过程生成5种不同的折叠
现在,为了从折叠中进行迭代,我有下一个代码片段:
cv = PurgedKFold(
n_splits=5,
samples_info_sets=pd.Series(df['close_datetime'].values, index = df['open_datetime'].values),
pct_embargo=0.2,
)
for a, (b, c) in enumerate(cv.split(X, y)):
...
a->折叠的编号
b和c是我不理解的元素
我想提取在每个折叠中选择的数据集行作为train ad测试子集。我怎么做