Pandas 为python数据帧创建固定和动态标头
我正在读取一个gzip文件,并通过下面的方法将其转换为数据帧Pandas 为python数据帧创建固定和动态标头,pandas,dataframe,Pandas,Dataframe,我正在读取一个gzip文件,并通过下面的方法将其转换为数据帧 df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False) 这实际上将第一行填充为列标题。由于gzip中的数据每次都会发生变化,因此列标题也会发生变化。此外,没有固定的列计数,因此根据文件的不同,它也会有所不同,如下所示 File 1 01-10-2019
df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False)
这实际上将第一行填充为列标题。由于gzip中的数据每次都会发生变化,因此列标题也会发生变化。此外,没有固定的列计数,因此根据文件的不同,它也会有所不同,如下所示
File 1
01-10-2019 Samsung Owned
-----------------------------
01-10-2019 Samsung Owned
03-10-2019 Motorolla Sold
File 2
SAMSUNG Walmart DHL 300$ Sold Alaska
--------------------------------------------------
SAMSUNG Walmart DHL 300$ Sold Alaska
Sony Motorolla Fedex 250$ Sold Chicago
对于我来说,如果我有一个固定的列作为1,2,3(基于dataframe所具有的列的数量),那么我可以进行一些数据操作
File 1
1 2 3
-----------------------------
01-10-2019 Samsung Owned
03-10-2019 Sony Sold
File 2
1 2 3 4 5 6
--------------------------------------------------
SAMSUNG Walmart DHL 300$ Sold Alaska
Sony Motorolla Fedex 250$ Sold Chicago
如果我理解正确,您不想从csv文件中读取标题。 可以使用
header=None
如果csv文件包含要忽略的标题,则还可以添加
skiprows=1
df = pd.read_csv(file.gz, compression='gzip', header=None, sep=',', quotechar='"', error_bad_lines=False)
如果我理解正确,您不想从csv文件中读取标题。 可以使用
header=None
如果csv文件包含要忽略的标题,则还可以添加
skiprows=1
df = pd.read_csv(file.gz, compression='gzip', header=None, sep=',', quotechar='"', error_bad_lines=False)