Python 如何透视DataFrame列以创建二进制文件；值表“；？_Python_Pandas_Dataframe_Binary_Categorical Data

Python 如何透视DataFrame列以创建二进制文件；值表“；？

python pandas dataframe binary

Python 如何透视DataFrame列以创建二进制文件；值表“；？,python,pandas,dataframe,binary,categorical-data,Python,Pandas,Dataframe,Binary,Categorical Data,我有以下数据帧： import pandas as pd df = pd.read_csv("filename.csv") df A B C D E 0 a 0.469112 -0.282863 -1.509059 cat 1 c -1.135632 1.212112 -0.173215 dog 2 e 0.119209 -1.044236 -0.861849 dog 3

我有以下数据帧：

import pandas as pd
df = pd.read_csv("filename.csv")

df 
     A   B         C         D        E    
0    a  0.469112 -0.282863 -1.509059  cat  
1    c -1.135632  1.212112 -0.173215  dog   
2    e  0.119209 -1.044236 -0.861849  dog   
3    f -2.104569 -0.494929  1.071804  bird   
4    g -2.224569 -0.724929  2.234213  elephant
...

我想根据

列E

中分类值的标识创建更多列，这样数据框看起来像这样：

 df 
         A   B         C         D        cat    dog     bird    elephant ....    
    0    a  0.469112 -0.282863 -1.509059  -1      0       0       0
    1    c -1.135632  1.212112 -0.173215   0     -1       0       0
    2    e  0.119209 -1.044236 -0.861849   0     -1       0       0
    3    f -2.104569 -0.494929  1.071804   0      0      -1       0
    4    g -2.224569 -0.724929  2.234213   0      0       0       0
    ...

也就是说，我将列

的值旋转为基于

的值的二进制矩阵，如果该值存在，则给出

，如果该值不存在，则给出

（这里，我希望它是

-1

或“负二进制矩阵”）

我不确定pandas中的哪个函数最适合这样做：可能是

pandas.DataFrame.unstack（）

任何洞见，谢谢

使用

pd.concat

，

drop

和

get\u假人

pd.concat([df.drop('E', 1), pd.get_dummies(df.E).mul(-1)], axis=1)