Python 3.x 从列到行的转换不起作用?
我们有一个数据框 我们需要转换成下面的数据帧 使用pd.wide_to_long命令时,我们得到以下错误:-Python 3.x 从列到行的转换不起作用?,python-3.x,pandas,Python 3.x,Pandas,我们有一个数据框 我们需要转换成下面的数据帧 使用pd.wide_to_long命令时,我们得到以下错误:- ValueError: stubname can't be identical to a column name 正在使用此命令:- pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1] 对于我来说
ValueError: stubname can't be identical to a column name
正在使用此命令:-
pd.wide_to_long(df,['Org','City'],i=['First Name','Middle Name','Last Name','Years'],j='drop').reset_index(level=[0,1]
对于我来说,您的解决方案正在运行,还添加了参数
stubnames
。Mayb eit是旧版本pandas中的错误,因此您可以尝试将pandas升级到最新版本:
df = pd.wide_to_long(df, stubnames=['Org','City'],
i=['First Name','Middle Name','Last Name','Years'],
j='drop').reset_index().drop('drop', 1)
print (df)
First Name Middle Name Last Name Years Org City
0 aa cc dd 2019 v n
1 aa cc dd 2019 m m
2 aa cc dd 2019 d n
3 aa cc dd 2019 p j
4 zz yy xx 2018 p n
5 zz yy xx 2018 q n
6 zz yy xx 2018 i d
7 zz yy xx 2018 NaN NaN
编辑:如果可能,数据中的某些重复项可能通过reset\u index
创建默认索引,并将列index
添加到i
变量:
print (df)
First Name Middle Name Last Name Years Org0 Org1 Org2 Org3 City0 City1 \
0 aa cc dd 2019 v m d p n m
1 zz yy xx 2018 p q i NaN n n
City2 City3
0 n j
1 d NaN
df = pd.wide_to_long(df.reset_index(), stubnames=['Org','City'],
i=['index','First Name','Middle Name','Last Name','Years'],
j='drop').reset_index().drop(['drop', 'index'], 1)
print (df)
First Name Middle Name Last Name Years Org City
0 aa cc dd 2019 v n
1 aa cc dd 2019 m m
2 aa cc dd 2019 d n
3 aa cc dd 2019 p j
4 zz yy xx 2018 p n
5 zz yy xx 2018 q n
6 zz yy xx 2018 i d
7 zz yy xx 2018 NaN NaN
谢谢@jezrael,但是如果我们需要stubname超过2列,那么我们会得到一个错误stubname不能与一列相同name@Amol-你能更具体一点吗?请参考这个问题::Getting error,当我们有18000(行)*71(列)这样的大数据集时错误::ValueError:id变量需要唯一地标识每一行,上面的代码适用于小数据集,适用于小数据集,而适用于大数据集,仍然会得到相同的错误