Csv 如何创建scikit学习数据集?

Csv 如何创建scikit学习数据集?,csv,machine-learning,dataset,scikit-learn,Csv,Machine Learning,Dataset,Scikit Learn,我有一个数组,其中第一列是类(整数形式),其余列是特征 像这样 1,0,34,23,2 0,0,21,11,0 3,11,2,11,1 如何将其转换为与scikit兼容的数据集,以便像调用sg一样调用 mydataset=datasets.load_mydataset()?您可以简单地使用pandas。e、 g.如果您已将数据集复制到dataset.csv文件。只需适当地标记csv文件中的列 In [1]: import pandas as pd In [2]: df = pd.read_c

我有一个数组,其中第一列是类(整数形式),其余列是特征

像这样

1,0,34,23,2
0,0,21,11,0
3,11,2,11,1
如何将其转换为与scikit兼容的数据集,以便像调用sg一样调用
mydataset=datasets.load_mydataset()?

您可以简单地使用pandas。e、 g.如果您已将数据集复制到dataset.csv文件。只需适当地标记csv文件中的列

In [1]: import pandas as pd

In [2]: df = pd.read_csv('temp.csv')

In [3]: df
Out[3]: 
   Label  f1  f2  f3  f4
0      1   0  34  23   2
1      0   0  21  11   0
2      3  11   2  11   1

In [4]: y_train= df['Label']

In [5]: x_train = df.drop('Label', axis=1)

In [6]: x_train
Out[6]: 
   f1  f2  f3  f4
0   0  34  23   2
1   0  21  11   0
2  11   2  11   1

In [7]: y_train
Out[7]: 
0    1
1    0
2    3