Python 重新格式化数据帧堆栈/取消堆栈_Python_Pandas_Reshape_Melt

Python 重新格式化数据帧堆栈/取消堆栈

python pandas

Python 重新格式化数据帧堆栈/取消堆栈,python,pandas,reshape,melt,Python,Pandas,Reshape,Melt,在过去的一天里，我一直在尝试重新塑造这个数据框架。修补堆叠/取消堆叠/熔化和将列转换为标记等，但未能实现我的目标所需输出具有以下列： df = pd.DataFrame({'BORDER':['GERMANY','FRANCE','ITALY','USA','CANADA','MEXICO','INDIA','CHINA','JAPAN' ], 'ASID':[21, 32, 99, 77,66,55,44,88,111], 'HOUR1':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6

在过去的一天里，我一直在尝试重新塑造这个数据框架。修补堆叠/取消堆叠/熔化和将列转换为标记等，但未能实现我的目标

所需输出具有以下列：

df = pd.DataFrame({'BORDER':['GERMANY','FRANCE','ITALY','USA','CANADA','MEXICO','INDIA','CHINA','JAPAN' ], 'ASID':[21, 32, 99, 77,66,55,44,88,111], 'HOUR1':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6],'HOUR2':[3 ,3 ,3, 5 ,5 ,5, 7, 7, 7], 'HOUR3':[8 ,8 ,8, 12 ,12 ,12, 99, 99, 99], 'PRICE1':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6], 'PRICE2':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6],'PRICE3':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6] })

df = df[['ASID', 'BORDER', 'HOUR1', 'PRICE1', 'HOUR2', 'PRICE2', 'HOUR3', 'PRICE3']]

我想将所有的

['HOUR1'，'HOUR2'，HOUR3']

堆叠到一个

列=HOUR

中

类似地，我希望将所有

['PRICE1'、'PRICE2'、'PRICE3']

堆叠在一个

列=PRICE

，以便此字段中的值与

HOUR

列中的相应值对齐。在

HOUR1

和

PRICE1

，

HOUR2

和

PRICE2

，

HOUR3

之间有一个链接

我很感激你能提供的任何指导

原始数据（请注意第二行“PRICE1”的更正）

首先，将索引设置为

ASID

和

BORDER

df = pd.DataFrame({'BORDER':['GERMANY','FRANCE','ITALY','USA','CANADA','MEXICO','INDIA','CHINA','JAPAN' ], 'ASID':[21, 32, 99, 77,66,55,44,88,111], 'HOUR1':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6],'HOUR2':[3 ,3 ,3, 5 ,5 ,5, 7, 7, 7], 'HOUR3':[8 ,8 ,8, 12 ,12 ,12, 99, 99, 99], 'PRICE1':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6], 'PRICE2':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6],'PRICE3':[2 ,2 ,2 ,4 ,4 ,4 ,6 ,6, 6] })

df = df[['ASID', 'BORDER', 'HOUR1', 'PRICE1', 'HOUR2', 'PRICE2', 'HOUR3', 'PRICE3']]

然后，为价格和小时创建两个数据帧，并叠加结果。从这些堆叠的数据帧中删除小时数和价格级别

df.set_index(['ASID', 'BORDER'], inplace=True)

最后，连接这两个数据帧并重命名列

prices = df[['PRICE1','PRICE2', 'PRICE3']].stack()
prices.index = prices.index.droplevel(2)
hours = df[['HOUR1', 'HOUR2', 'HOUR3']].stack()
hours.index = hours.index.droplevel(2)

我喜欢。非常感谢你。谢谢。

prices = df[['PRICE1','PRICE2', 'PRICE3']].stack()
prices.index = prices.index.droplevel(2)
hours = df[['HOUR1', 'HOUR2', 'HOUR3']].stack()
hours.index = hours.index.droplevel(2)

df_new = pd.concat([hours, prices], axis=1)
df_new.columns = ['HOUR', 'PRICE']

>>> df_new
              HOUR  PRICE
ASID BORDER              
21   GERMANY     2      2
     GERMANY     3      2
     GERMANY     8      2
32   FRANCE      2      2
     FRANCE      3      2
     FRANCE      8      2
99   ITALY       2      2
     ITALY       3      2
     ITALY       8      2
77   USA         4      4
     USA         5      4
     USA        12      4
66   CANADA      4      4
     CANADA      5      4
     CANADA     12      4
55   MEXICO      4      4
     MEXICO      5      4
     MEXICO     12      4
44   INDIA       6      6
     INDIA       7      6
     INDIA      99      6
88   CHINA       6      6
     CHINA       7      6
     CHINA      99      6
111  JAPAN       6      6
     JAPAN       7      6
     JAPAN      99      6