Python 用键分割数据帧
我有一个大的CSV文件(有超过700万条记录),有30列,其中列中的一些数据是短代码,例如“ORD”或从1到12的月数。 我想写一个循环,将这个csv文件分割成一个给定密钥上的小文件,例如,我想创建12个csv,每个月的密钥是名称(这意味着my_csv_1.csv、my_csv_2.csv等)或每个代码(my_csv_code1.csv、my_csv_code2.csv等) 以下是我的尝试:Python 用键分割数据帧,python,dataframe,Python,Dataframe,我有一个大的CSV文件(有超过700万条记录),有30列,其中列中的一些数据是短代码,例如“ORD”或从1到12的月数。 我想写一个循环,将这个csv文件分割成一个给定密钥上的小文件,例如,我想创建12个csv,每个月的密钥是名称(这意味着my_csv_1.csv、my_csv_2.csv等)或每个代码(my_csv_code1.csv、my_csv_code2.csv等) 以下是我的尝试: for i in range(1,len(my_csv.Month.unique())+1):
for i in range(1,len(my_csv.Month.unique())+1):
my_csv_i = my_csv[(my_csv['Month'] == i) | (my_csv['Month']==i)]
my_csv_i.to_csv
您可以使用
groupby
:
for k,g in df.groupby('Month'):
g.to_csv('my_csv_{}.csv'.format(k))