Python 3.x 从列到行的转换不起作用?

Python 3.x 从列到行的转换不起作用?,python-3.x,pandas,Python 3.x,Pandas,我们有一个数据框 我们需要转换成下面的数据帧 使用pd.wide_to_long命令时,我们得到以下错误:- ValueError: stubname can't be identical to a column name 正在使用此命令:- pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1] 对于我来说

我们有一个数据框

我们需要转换成下面的数据帧

使用pd.wide_to_long命令时,我们得到以下错误:-

ValueError: stubname can't be identical to a column name
正在使用此命令:-

pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1]

对于我来说,您的解决方案正在运行,还添加了参数
stubnames
。Mayb eit是旧版本pandas中的错误,因此您可以尝试将pandas升级到最新版本:

df = pd.wide_to_long(df, stubnames=['Org','City'],
                     i=['First Name','Middle Name','Last Name','Years'],
                     j='drop').reset_index().drop('drop', 1)
print (df)
  First Name Middle Name Last Name  Years  Org City
0         aa          cc        dd   2019    v    n
1         aa          cc        dd   2019    m    m
2         aa          cc        dd   2019    d    n
3         aa          cc        dd   2019    p    j
4         zz          yy        xx   2018    p    n
5         zz          yy        xx   2018    q    n
6         zz          yy        xx   2018    i    d
7         zz          yy        xx   2018  NaN  NaN
编辑:如果可能,数据中的某些重复项可能通过
reset\u index
创建默认索引,并将列
index
添加到
i
变量:

print (df)
  First Name Middle Name Last Name  Years Org0 Org1 Org2 Org3 City0 City1  \
0         aa          cc        dd   2019    v    m    d    p     n     m   
1         zz          yy        xx   2018    p    q    i  NaN     n     n   

  City2 City3  
0     n     j  
1     d   NaN  

df = pd.wide_to_long(df.reset_index(), stubnames=['Org','City'],
                     i=['index','First Name','Middle Name','Last Name','Years'],
                     j='drop').reset_index().drop(['drop', 'index'], 1)
print (df)
  First Name Middle Name Last Name  Years  Org City
0         aa          cc        dd   2019    v    n
1         aa          cc        dd   2019    m    m
2         aa          cc        dd   2019    d    n
3         aa          cc        dd   2019    p    j
4         zz          yy        xx   2018    p    n
5         zz          yy        xx   2018    q    n
6         zz          yy        xx   2018    i    d
7         zz          yy        xx   2018  NaN  NaN

谢谢@jezrael,但是如果我们需要stubname超过2列,那么我们会得到一个错误stubname不能与一列相同name@Amol-你能更具体一点吗?请参考这个问题::Getting error,当我们有18000(行)*71(列)这样的大数据集时错误::ValueError:id变量需要唯一地标识每一行,上面的代码适用于小数据集,适用于小数据集,而适用于大数据集,仍然会得到相同的错误