Csv Python,如何导入具有垂直堆叠列标题、@relation、@attribute、@data的数据集?

Csv Python,如何导入具有垂直堆叠列标题、@relation、@attribute、@data的数据集?,csv,pandas,dataset,arff,Csv,Pandas,Dataset,Arff,我试图从timeseriesclassification.com加载数据集,但数据集的格式是我以前从未见过的 .csv文件如下所示: @relation Wine @attribute att0 numeric @attribute att1 numeric @attribute target {1 2} @data 0,1,1 0,0,0 1,0,0 这就是数据的格式化方式 att0,att1,target 0,1,1 0,0,0 1,0,0 这是我目前的策略: 使用文件('f

我试图从timeseriesclassification.com加载数据集,但数据集的格式是我以前从未见过的

.csv文件如下所示:

@relation Wine
@attribute att0 numeric
@attribute att1 numeric
@attribute target {1    2}
@data   
0,1,1
0,0,0
1,0,0
这就是数据的格式化方式

att0,att1,target
0,1,1
0,0,0
1,0,0
这是我目前的策略:

  • 使用文件('filename.csv)读取文件
  • 计算行数,直到出现@data
  • 删除所有标题,并使用熊猫导入数据
  • 添加新列名
  • 有人知道此数据集的格式类型吗?还有谁能给我指一个可以引用不同数据集格式的资源。

    使用Scipy读取文件

    使用Scipy读取文件

    该格式是.arff(属性关系文件格式)文件。您可以使用scipy.io.arff python模块读取它。

    该格式是一个.arff(属性关系文件格式)文件。您可以使用scipy.io.arff python模块阅读它

    In [94]: from scipy.io.arff import loadarff
    
    In [95]: dataset = loadarff(open('filename.csv','r'))
    
    In [96]: df = pd.DataFrame(dataset[0], columns=dataset[1].names())
    
    In [97]: df
    Out[97]:
       att0  att1 target
    0   0.0   1.0      1
    1   0.0   0.0      0
    2   1.0   0.0      0