Pandas &引用;[Int64Index、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、\n……数据类型=';int64';)均不在[列]中;

Pandas &引用;[Int64Index、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、\n……数据类型=';int64';)均不在[列]中;,pandas,dataframe,scikit-learn,Pandas,Dataframe,Scikit Learn,我目前正在尝试对我的pandas数据帧执行KFold,该数据帧从csv读取pandas文件。不幸的是,我得到了一个错误: [Int64Index、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、\n……dtype='int64')中没有一个在[列]中 这是我的密码: def getSlicesOfData(read_csv): slice_training_data = read_csv[["player", "0", "1", "2",

我目前正在尝试对我的pandas数据帧执行KFold,该数据帧从csv读取pandas文件。不幸的是,我得到了一个错误:

[Int64Index、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、\n……dtype='int64')中没有一个在[列]中

这是我的密码:

def getSlicesOfData(read_csv):
    slice_training_data = read_csv[["player", "0", "1", "2", "3", "4", "5", "6", "7", "8"]]
    slice_prediction_data = read_csv[["best_move"]]
    return (slice_training_data, slice_prediction_data)

def getKFold(data_sliced):
    kf = KFold(n_splits=10, random_state=None, shuffle=False)
    return kf.split(data_sliced[0],data_sliced[1])
    #return TimeSeriesSplit(n_splits=10, max_train_size=9)

if __name__ == "__main__":
    read_csv = pd.read_csv('100games.csv')
    data_slice = getSlicesOfData(read_csv)
    for train_index, test_index in getKFold(data_slice):
        x_train, x_test = data_slice[0][train_index], data_slice[0][test_index]
        y_train, y_test = data_slice[1][train_index],data_slice[1][test_index]
如果我试图通过以下方式获取培训数据时出错了怎么办:

x_train, x_test = data_slice[0][train_index], data_slice[0][test_index]
            y_train, y_test = data_slice[1][train_index],data_slice[1][test_index]

您试图在熊猫数据帧上执行K折叠,这就是问题所在。尝试将数据结构从pandas改为numpy,然后重新运行代码。最后,您可能希望将数据结构从numpy更改回pandas

使用:
数据片[0]转换为numpy。值[train\u index]

尝试:


另请参见:

可能重复的,我已经尝试过了,但我只是得到了一个类似的错误
if __name__ == "__main__":
    read_csv = pd.read_csv('100games.csv')
    data_slice = getSlicesOfData(read_csv)
    for train_index, test_index in getKFold(data_slice):
        x_train, x_test = data_slice[0].values[train_index], data_slice[0].values[test_index]
        y_train, y_test = data_slice[1].values[train_index], data_slice[1].values[test_index]