Python 3.x 从列到行的转换不起作用？_Python 3.x_Pandas

Python 3.x 从列到行的转换不起作用？

python-3.x pandas

Python 3.x 从列到行的转换不起作用？,python-3.x,pandas,Python 3.x,Pandas,我们有一个数据框我们需要转换成下面的数据帧使用pd.wide_to_long命令时，我们得到以下错误：- ValueError: stubname can't be identical to a column name 正在使用此命令：- pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1] 对于我来说

我们有一个数据框

我们需要转换成下面的数据帧

使用pd.wide_to_long命令时，我们得到以下错误：-

ValueError: stubname can't be identical to a column name

正在使用此命令：-

pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1]

对于我来说，您的解决方案正在运行，还添加了参数

stubnames

。Mayb eit是旧版本pandas中的错误，因此您可以尝试将pandas升级到最新版本：

df = pd.wide_to_long(df, stubnames=['Org','City'],
                     i=['First Name','Middle Name','Last Name','Years'],
                     j='drop').reset_index().drop('drop', 1)
print (df)
  First Name Middle Name Last Name  Years  Org City
0         aa          cc        dd   2019    v    n
1         aa          cc        dd   2019    m    m
2         aa          cc        dd   2019    d    n
3         aa          cc        dd   2019    p    j
4         zz          yy        xx   2018    p    n
5         zz          yy        xx   2018    q    n
6         zz          yy        xx   2018    i    d
7         zz          yy        xx   2018  NaN  NaN

编辑：如果可能，数据中的某些重复项可能通过

reset\u index

创建默认索引，并将列

index

添加到

变量：

print (df)
  First Name Middle Name Last Name  Years Org0 Org1 Org2 Org3 City0 City1  \
0         aa          cc        dd   2019    v    m    d    p     n     m   
1         zz          yy        xx   2018    p    q    i  NaN     n     n   

  City2 City3  
0     n     j  
1     d   NaN  

df = pd.wide_to_long(df.reset_index(), stubnames=['Org','City'],
                     i=['index','First Name','Middle Name','Last Name','Years'],
                     j='drop').reset_index().drop(['drop', 'index'], 1)
print (df)
  First Name Middle Name Last Name  Years  Org City
0         aa          cc        dd   2019    v    n
1         aa          cc        dd   2019    m    m
2         aa          cc        dd   2019    d    n
3         aa          cc        dd   2019    p    j
4         zz          yy        xx   2018    p    n
5         zz          yy        xx   2018    q    n
6         zz          yy        xx   2018    i    d
7         zz          yy        xx   2018  NaN  NaN

谢谢@jezrael，但是如果我们需要stubname超过2列，那么我们会得到一个错误stubname不能与一列相同name@Amol-你能更具体一点吗？请参考这个问题：：Getting error，当我们有18000（行）*71（列）这样的大数据集时错误：：ValueError：id变量需要唯一地标识每一行，上面的代码适用于小数据集，适用于小数据集，而适用于大数据集，仍然会得到相同的错误