Python 如何将列名用作数据框中的值?
我有一个数据框:Python 如何将列名用作数据框中的值?,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个数据框: df = DataFrame({'B' : ('A','B','C','D','E','F','G'), 'C' : (1,3,5,6,8,2,5), 'D' : (5,2,6,9,3,7,3)}) B C D 0 A 1 5 1 B 3 2 2 C 5 6 3 D 6 9 4 E 8 3 5 F 2 7 6 G 5 3 我需要使计算变得出色。对我来说方便的格式是: B description
df = DataFrame({'B' : ('A','B','C','D','E','F','G'), 'C' : (1,3,5,6,8,2,5), 'D' : (5,2,6,9,3,7,3)})
B C D
0 A 1 5
1 B 3 2
2 C 5 6
3 D 6 9
4 E 8 3
5 F 2 7
6 G 5 3
我需要使计算变得出色。对我来说方便的格式是:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3
是否有方法将列名用作值您可以使用方便的
pd.melt
为此,请参阅@unutbu的答案。更通用的方法是使用,但这需要更多的手动调整:
In [139]: df.set_index('B').stack().reset_index()
Out[139]:
B level_1 0
0 A C 1
1 A D 5
2 B C 3
3 B D 2
4 C C 5
5 C D 6
6 D C 6
7 D D 9
8 E C 8
9 E D 3
10 F C 2
11 F D 7
12 G C 5
13 G D 3
重命名和排序后:
In [150]: result = df.set_index('B').stack().reset_index()
In [151]: result = result.rename(columns={'level_1':'description', 0:'value'})
In [152]: result.sort(['description', 'B']).reset_index(drop=True)
Out[152]:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3
您可以使用:
不清楚您想要的输出是如何生成的。您能清楚地解释一下吗?基本上,我想要的是将每个列(但B)的值附加到数据帧中,并添加一个列,该列的值与每个值关联的列的名称相同。我将对问题进行编辑,使其更清晰相关:
In [13]: pd.melt(df, id_vars=['B'], var_name='description')
Out[13]:
B description value
0 A C 1
1 B C 3
2 C C 5
3 D C 6
4 E C 8
5 F C 2
6 G C 5
7 A D 5
8 B D 2
9 C D 6
10 D D 9
11 E D 3
12 F D 7
13 G D 3