Python 基于一列保存数据，并以另一列命名_Python_Pandas_Numpy_Scipy_Scikit Learn

Python 基于一列保存数据，并以另一列命名

python pandas numpy scikit-learn

Python 基于一列保存数据，并以另一列命名,python,pandas,numpy,scipy,scikit-learn,Python,Pandas,Numpy,Scipy,Scikit Learn,我有一个以下格式的数据集： A B LABEL NEW -0.027651 -0.068485 5 1 -0.039997 -0.071371 5 1 -0.032667 -0.078227 5 1 -0.021502 -0.083501

我有一个以下格式的数据集：

    A                 B             LABEL   NEW
-0.027651         -0.068485            5      1  
-0.039997         -0.071371            5      1  
-0.032667         -0.078227            5      1  
-0.021502         -0.083501            5      1  
-0.018613         -0.082452            5      1  
 0.134058         -0.145095            7      2  
-0.164757          0.029179            4      3  
-0.124876          0.022431            4      3  
-0.076959         -0.021404            4      3
-0.221781          0.163064            8      4  
 0.137542         -0.250567            5      5  
 0.048786         -0.153115            5      5  
-0.001230         -0.095431            5      5

我想按新列值1拆分数据帧：

    A                 B             LABEL      NEW
-0.027651         -0.068485            5     1  
-0.039997         -0.071371            5     1  
-0.032667         -0.078227            5     1  
-0.021502         -0.083501            5     1  
-0.018613         -0.082452            5     1

并根据该标签的名称保存：类似（新标签）-->“1-5.csv”

我有7000行，需要动态拆分和保存，

使用

groupby

打开

NEW

进行拆分

In [11]: for n, g in df.groupby('NEW'):
    ...:     g.to_csv('{}.csv'.format(n))

使用

NEW

上的

groupby

进行拆分

In [11]: for n, g in df.groupby('NEW'):
    ...:     g.to_csv('{}.csv'.format(n))

现在我明白你的意思了

for x,df1 in df.groupby('NEW'):
    df1.to_csv("%s.csv" % x)

更新

for x,df1 in df.groupby('NEW'):
    df1.to_csv("%s-%s.csv" % (x,df1.LABEL[0]))

现在我明白你的意思了

for x,df1 in df.groupby('NEW'):
    df1.to_csv("%s.csv" % x)

更新

for x,df1 in df.groupby('NEW'):
    df1.to_csv("%s-%s.csv" % (x,df1.LABEL[0]))

抱歉，回复太晚，现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW，这是正确的，但我还需要输入它所属的标签，这样我可以在保存文件时将其写入，如“NEW-label.csv”即1-5.csv等。对于延迟回复，现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW，这是正确的，但我还需要输入它所属的标签，这样我可以在保存文件时将其写入，如“NEW-label.csv”即1-5.csv等。对于延迟回复，现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW，这是正确的，但我还需要输入它所属的标签，这样我可以在保存文件时将其写入，如pandas中的“NEW-label.csv”即1-5.csv等文件“pandas/_libs/index.pyx”，第83行。_libs.index.IndexEngine.get_值文件“pandas/_libs/index.pyx”，第91行，在pandas.\u libs.index.IndexEngine.get_值文件“pandas/\u libs/index.pyx”，第139行，在pandas.\u libs.index.IndexEngine.get_loc文件“pandas/\u libs/hashtable\u class\u helper.pxi”，第811行，在pandas.\u libs.hashtable.Int64HashTable.get_项文件“pandas/\u libs/hashtable\u class\u helper.pxi”，第817行，在pandas._libs.hashtable.Int64HashTable.get_items中，很抱歉回复太晚，现在文件保存在1.csv、2.csv、3.csv。。。。。其中1 2 3来自groupby列NEW，这是正确的，但我还需要输入它所属的标签，这样我可以在保存文件时将其写入，如pandas中的“NEW-label.csv”即1-5.csv等文件“pandas/_libs/index.pyx”，第83行。_libs.index.IndexEngine.get_值文件“pandas/_libs/index.pyx”，第91行，在pandas.\u libs.index.IndexEngine.get_值文件“pandas/\u libs/index.pyx”，第139行，在pandas.\u libs.index.IndexEngine.get_loc文件“pandas/\u libs/hashtable\u class\u helper.pxi”，第811行，在pandas.\u libs.hashtable.Int64HashTable.get_项目文件“pandas/\u libs/hashtable\u class\u helper.pxi”，第817行，在pandas.\libs.hashtable.Int64HashTable.int hashtable.get_项目中