Python 如何透视DataFrame列以创建二进制文件;值表“;?
我有以下数据帧:Python 如何透视DataFrame列以创建二进制文件;值表“;?,python,pandas,dataframe,binary,categorical-data,Python,Pandas,Dataframe,Binary,Categorical Data,我有以下数据帧: import pandas as pd df = pd.read_csv("filename.csv") df A B C D E 0 a 0.469112 -0.282863 -1.509059 cat 1 c -1.135632 1.212112 -0.173215 dog 2 e 0.119209 -1.044236 -0.861849 dog 3
import pandas as pd
df = pd.read_csv("filename.csv")
df
A B C D E
0 a 0.469112 -0.282863 -1.509059 cat
1 c -1.135632 1.212112 -0.173215 dog
2 e 0.119209 -1.044236 -0.861849 dog
3 f -2.104569 -0.494929 1.071804 bird
4 g -2.224569 -0.724929 2.234213 elephant
...
我想根据列E
中分类值的标识创建更多列,这样数据框看起来像这样:
df
A B C D cat dog bird elephant ....
0 a 0.469112 -0.282863 -1.509059 -1 0 0 0
1 c -1.135632 1.212112 -0.173215 0 -1 0 0
2 e 0.119209 -1.044236 -0.861849 0 -1 0 0
3 f -2.104569 -0.494929 1.071804 0 0 -1 0
4 g -2.224569 -0.724929 2.234213 0 0 0 0
...
也就是说,我将列E
的值旋转为基于E
的值的二进制矩阵,如果该值存在,则给出1
,如果该值不存在,则给出0
(这里,我希望它是-1
或“负二进制矩阵”)
我不确定pandas中的哪个函数最适合这样做:可能是pandas.DataFrame.unstack()
任何洞见,谢谢 使用
pd.concat
,drop
和get\u假人
pd.concat([df.drop('E', 1), pd.get_dummies(df.E).mul(-1)], axis=1)