Pandas 为python数据帧创建固定和动态标头

Pandas 为python数据帧创建固定和动态标头,pandas,dataframe,Pandas,Dataframe,我正在读取一个gzip文件,并通过下面的方法将其转换为数据帧 df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False) 这实际上将第一行填充为列标题。由于gzip中的数据每次都会发生变化,因此列标题也会发生变化。此外,没有固定的列计数,因此根据文件的不同,它也会有所不同,如下所示 File 1 01-10-2019

我正在读取一个gzip文件,并通过下面的方法将其转换为数据帧

   df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False)
这实际上将第一行填充为列标题。由于gzip中的数据每次都会发生变化,因此列标题也会发生变化。此外,没有固定的列计数,因此根据文件的不同,它也会有所不同,如下所示

File 1 
        01-10-2019  Samsung    Owned
        -----------------------------
        01-10-2019  Samsung    Owned
        03-10-2019  Motorolla  Sold

File 2 
         SAMSUNG    Walmart    DHL    300$  Sold  Alaska
        --------------------------------------------------
        SAMSUNG    Walmart    DHL     300$  Sold  Alaska   
        Sony       Motorolla  Fedex   250$  Sold  Chicago
    
对于我来说,如果我有一个固定的列作为1,2,3(基于dataframe所具有的列的数量),那么我可以进行一些数据操作

 File 1 
            1            2         3
            -----------------------------
            01-10-2019  Samsung    Owned
            03-10-2019  Sony       Sold
File 2 
          1         2         3        4    5      6
        --------------------------------------------------
        SAMSUNG    Walmart    DHL     300$  Sold  Alaska   
        Sony       Motorolla  Fedex   250$  Sold  Chicago

如果我理解正确,您不想从csv文件中读取标题。 可以使用
header=None

如果csv文件包含要忽略的标题,则还可以添加
skiprows=1

df = pd.read_csv(file.gz, compression='gzip', header=None, sep=',', quotechar='"', error_bad_lines=False)

如果我理解正确,您不想从csv文件中读取标题。 可以使用
header=None

如果csv文件包含要忽略的标题,则还可以添加
skiprows=1

df = pd.read_csv(file.gz, compression='gzip', header=None, sep=',', quotechar='"', error_bad_lines=False)