Python 如何更改数据帧的格式？_Python_Pandas

Python 如何更改数据帧的格式？

python pandas

Python 如何更改数据帧的格式？,python,pandas,Python,Pandas,我有一个数据帧df，格式如下： df = MONTH WEEKDAY EVAL 1 0 1 1 0 0 1 0 0 1 1 1 1 1 0 2 0 0 2 0 0 2 1 1 我将数据分组如下： result = df.groupby(['MONTH','WEEKD

我有一个数据帧

df

，格式如下：

df =
MONTH   WEEKDAY   EVAL
1       0         1
1       0         0
1       0         0
1       1         1
1       1         0
2       0         0
2       0         0
2       1         1

我将数据分组如下：

result = df.groupby(['MONTH','WEEKDAY','EVAL']).size().reset_index()
result

它输出结果的方式与我想要得到的不同：

MONTH  WEEKDAY  EVAL  0
1      0        0     400
1      0        1     20
1      1        0     300 
1      1        1     20
2      0        0     200
2      0        1     35
2      1        0     450
2      1        1     26

我想将

结果的格式更改为以下格式：
WEEKDAY   EVAL_0   EVAL_1
0         400      20
0         200      35
1         300      20
1         450      26

我该怎么做呢？
我认为您需要通过重塑，然后需要进行一些数据清理：
df = df.set_index(['MONTH','WEEKDAY','EVAL'])['0'].unstack()

#if get ValueError: Index contains duplicate entries, cannot reshape
#if duplicates and necessary aggregate data with mean, sum...
#df = df.groupby(['MONTH','WEEKDAY','EVAL'])['0'].mean().unstack()
#df = df.pivot_table(index=['MONTH','WEEKDAY'], columns='EVAL', values='0', aggfunc='mean')

print (df)
EVAL             0   1
MONTH WEEKDAY         
1     0        400  20
      1        300  20
2     0        200  35
      1        450  26

df = df.sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
       .add_prefix('EVAL_')
       .reset_index()
       .rename_axis(None, axis=1)
print (df)
   WEEKDAY  EVAL_0  EVAL_1
0        0     400      20
1        0     200      35
2        1     300      20
3        1     450      26

带有副本的样本：
print (df)
   MONTH  WEEKDAY  EVAL    0
0      1        0     0  400
1      1        0     1   20
2      1        1     0  300
3      1        1     1   20
4      2        0     0  200
5      2        0     1   35
6      2        1     0  450
7      2        1     1   26
8      2        1     1  100 <-duplicate

df = df.groupby(['MONTH','WEEKDAY','EVAL'])['0'].mean().unstack()

df = df.sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
       .add_prefix('EVAL_')
       .reset_index()
       .rename_axis(None, axis=1)
print (df)
   WEEKDAY  EVAL_0  EVAL_1
0        0     400      20
1        0     200      35
2        1     300      20
3        1     450      63 <- value is mean of (100 + 26)/2

打印（df）
月工作日评估0
0      1        0     0  400
1      1        0     1   20
2      1        1     0  300
3      1        1     1   20
4      2        0     0  200
5      2        0     1   35
6      2        1     0  450
7      2        1     1   26
8 2 1 100当我将['0'].unstack（）
更改为[0].unstack（）
时，它对我起了作用。谢谢，我忘了，对不起。您可以通过result=df.groupby（['MONTH'、'WEEKDAY'、'EVAL']）.size（）将0
更改为相同的值。重置索引（name='COL'）
。非常感谢。