Python 基于一列保存数据,并以另一列命名
我有一个以下格式的数据集:Python 基于一列保存数据,并以另一列命名,python,pandas,numpy,scipy,scikit-learn,Python,Pandas,Numpy,Scipy,Scikit Learn,我有一个以下格式的数据集: A B LABEL NEW -0.027651 -0.068485 5 1 -0.039997 -0.071371 5 1 -0.032667 -0.078227 5 1 -0.021502 -0.083501
A B LABEL NEW
-0.027651 -0.068485 5 1
-0.039997 -0.071371 5 1
-0.032667 -0.078227 5 1
-0.021502 -0.083501 5 1
-0.018613 -0.082452 5 1
0.134058 -0.145095 7 2
-0.164757 0.029179 4 3
-0.124876 0.022431 4 3
-0.076959 -0.021404 4 3
-0.221781 0.163064 8 4
0.137542 -0.250567 5 5
0.048786 -0.153115 5 5
-0.001230 -0.095431 5 5
我想按新列值1拆分数据帧:
A B LABEL NEW
-0.027651 -0.068485 5 1
-0.039997 -0.071371 5 1
-0.032667 -0.078227 5 1
-0.021502 -0.083501 5 1
-0.018613 -0.082452 5 1
并根据该标签的名称保存:
类似(新标签)-->“1-5.csv”
我有7000行,需要动态拆分和保存,使用
groupby
打开NEW
进行拆分
In [11]: for n, g in df.groupby('NEW'):
...: g.to_csv('{}.csv'.format(n))
使用
NEW
上的groupby
进行拆分
In [11]: for n, g in df.groupby('NEW'):
...: g.to_csv('{}.csv'.format(n))
现在我明白你的意思了
for x,df1 in df.groupby('NEW'):
df1.to_csv("%s.csv" % x)
更新
for x,df1 in df.groupby('NEW'):
df1.to_csv("%s-%s.csv" % (x,df1.LABEL[0]))
现在我明白你的意思了
for x,df1 in df.groupby('NEW'):
df1.to_csv("%s.csv" % x)
更新
for x,df1 in df.groupby('NEW'):
df1.to_csv("%s-%s.csv" % (x,df1.LABEL[0]))
抱歉,回复太晚,现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW,这是正确的,但我还需要输入它所属的标签,这样我可以在保存文件时将其写入,如“NEW-label.csv”即1-5.csv等。对于延迟回复,现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW,这是正确的,但我还需要输入它所属的标签,这样我可以在保存文件时将其写入,如“NEW-label.csv”即1-5.csv等。对于延迟回复,现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW,这是正确的,但我还需要输入它所属的标签,这样我可以在保存文件时将其写入,如pandas中的“NEW-label.csv”即1-5.csv等文件“pandas/_libs/index.pyx”,第83行。_libs.index.IndexEngine.get_值文件“pandas/_libs/index.pyx”,第91行,在pandas.\u libs.index.IndexEngine.get_值文件“pandas/\u libs/index.pyx”,第139行,在pandas.\u libs.index.IndexEngine.get_loc文件“pandas/\u libs/hashtable\u class\u helper.pxi”,第811行,在pandas.\u libs.hashtable.Int64HashTable.get_项文件“pandas/\u libs/hashtable\u class\u helper.pxi”,第817行,在pandas._libs.hashtable.Int64HashTable.get_items中,很抱歉回复太晚,现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW,这是正确的,但我还需要输入它所属的标签,这样我可以在保存文件时将其写入,如pandas中的“NEW-label.csv”即1-5.csv等文件“pandas/_libs/index.pyx”,第83行。_libs.index.IndexEngine.get_值文件“pandas/_libs/index.pyx”,第91行,在pandas.\u libs.index.IndexEngine.get_值文件“pandas/\u libs/index.pyx”,第139行,在pandas.\u libs.index.IndexEngine.get_loc文件“pandas/\u libs/hashtable\u class\u helper.pxi”,第811行,在pandas.\u libs.hashtable.Int64HashTable.get_项目文件“pandas/\u libs/hashtable\u class\u helper.pxi”,第817行,在pandas.\libs.hashtable.Int64HashTable.int hashtable.get_项目中