Python 将数据框重塑为重复行数相同的列_Python_Pandas

Python 将数据框重塑为重复行数相同的列

python pandas

Python 将数据框重塑为重复行数相同的列,python,pandas,Python,Pandas,我有这个数据框： >> df = pd.DataFrame({'Place' : ['A', 'A', 'B', 'B', 'C', 'C'], 'Var' : ['All', 'French', 'All', 'German', 'All', 'Spanish'], 'Values' : [250, 30, 120, 12, 200, 112]}) >> df Place Values Var 0 A 250 All 1

我有这个数据框：

>> df = pd.DataFrame({'Place' : ['A', 'A', 'B', 'B', 'C', 'C'], 'Var' : ['All', 'French', 'All', 'German', 'All', 'Spanish'], 'Values' : [250, 30, 120, 12, 200, 112]})

>> df
  Place  Values      Var
0     A     250      All
1     A      30   French
2     B     120      All
3     B      12   German
4     C     200      All
5     C     112  Spanish

对于每个

位置

，它有两行的重复模式。我想改变它的形状，使每个

Place

有一行，

Var

列变成两列，一列表示“全部”，另一列表示另一个值

像这样：

Place   All   Language   Value
    A   250     French      30
    B   120     German      12
    C   200     Spanish    112

数据透视表将为每个唯一的值生成一列，我不希望这样

这方面的重塑方法是什么？

由于数据以交替模式出现，我们可以分两步对转换进行概念化

步骤1：

从

a,a,a
b,b,b

到

步骤2：删除冗余列

以下解决方案将

重塑

应用于数据帧的

值

；重塑的参数是

（-1，df.shape[1]*2）

，它说“给我一个框架，它的列数和行数是你能管理的两倍。”

然后，我根据您的数据布局，硬连线了过滤器的列索引：

[0,1,4,5]

。生成的

numpy

数组有4列，因此我们将其与正确的列名一起传递到

DataFrame

构造函数中

这是一个不可读的解决方案，它依赖于

df

布局，并以错误的顺序生成列

import pandas as pd

df = pd.DataFrame({'Place' : ['A', 'A', 'B', 'B', 'C', 'C'], 'Var' : ['All', 'French', 'All', 'German', 'All', 'Spanish'], 'Values' : [250, 30, 120, 12, 200, 112]})

df = pd.DataFrame(df.values.reshape(-1, df.shape[1] * 2)[:,[0,1,4,5]],
    columns = ['Place', 'All', 'Value', 'Language'])

另一种方法：

df = pd.DataFrame({'Place' : ['A', 'A', 'B', 'B', 'C', 'C'], 'Var' : ['All', 'French', 'All', 'German', 'All', 'Spanish'], 'Values' : [250, 30, 120, 12, 200, 112]})

df1 = df.set_index('Place').pivot(columns='Var')

df1.columns = df1.columns.droplevel()

df1 = df1.set_index('All', append=True).stack().reset_index()

print(df1)

输出：

  Place    All      Var      0
0     A  250.0   French   30.0
1     B  120.0   German   12.0
2     C  200.0  Spanish  112.0

这管用！但我不太明白怎么做。你能解释一下你的过程吗？谢谢。所以-1作为

numpy.reformate

的一个参数，可以确保无论其他参数是什么，都能保持维度？是的，非常有用的速记符号。非常有趣的解决方案。

droplevel

和

stack

的使用非常巧妙。

  Place    All      Var      0
0     A  250.0   French   30.0
1     B  120.0   German   12.0
2     C  200.0  Spanish  112.0