Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 2.7 在Python中将这个单词DataFrame转换为零一矩阵格式的DataFrame_Python 2.7_Pandas_Dataframe_Sklearn Pandas - Fatal编程技术网

Python 2.7 在Python中将这个单词DataFrame转换为零一矩阵格式的DataFrame

Python 2.7 在Python中将这个单词DataFrame转换为零一矩阵格式的DataFrame,python-2.7,pandas,dataframe,sklearn-pandas,Python 2.7,Pandas,Dataframe,Sklearn Pandas,要将用户Id和技能数据帧矩阵转换为零一数据帧矩阵格式用户及其相应技能 输入数据帧 user_Id skills 0 user1 [java, hdfs, hadoop] 1 user2 [python, c++, c] 2 user3 [hadoop, java, hdfs] 3 user4 [h

要将用户Id和技能数据帧矩阵转换为零一数据帧矩阵格式用户及其相应技能

输入数据帧

     user_Id                        skills

0     user1               [java, hdfs, hadoop]
1     user2               [python, c++, c]
2     user3               [hadoop, java, hdfs]
3     user4               [html, java, php]
4     user5               [hadoop, php, hdfs]
user_Id       java  c   c++     hadoop  hdfs    python  html    php     

user1         1     0   0       1       1       0       0       0
user2         0     1   1       0       0       1       0       0
 user3        1     0   0       1       1       0       0       0
user4         1     0   0       0       0       0       1       1
user5         0     0   0       1       1       0       0       1
期望输出数据帧

     user_Id                        skills

0     user1               [java, hdfs, hadoop]
1     user2               [python, c++, c]
2     user3               [hadoop, java, hdfs]
3     user4               [html, java, php]
4     user5               [hadoop, php, hdfs]
user_Id       java  c   c++     hadoop  hdfs    python  html    php     

user1         1     0   0       1       1       0       0       0
user2         0     1   1       0       0       1       0       0
 user3        1     0   0       1       1       0       0       0
user4         1     0   0       0       0       0       1       1
user5         0     0   0       1       1       0       0       1
如果需要,您可以将创建的新的
DataFrame
列表转换为
str
(否则省略),然后删除
[]
,并使用:



栏中,技能
列表
?非常感谢!!它对我有用,而且是非常优化的解决方案:)那么
df.columns=df.columns.str.encode(“utf-8”)
?不,但这行对我有用
df1.columns=df1.columns.str.strip(“u”)
,但同样的解决方案不适用于这个问题@jezrael
用户Id技能0用户1“java,hdfs,hadoop”1用户2“Python,C++,C”2用户3“Hadoop,java,HDFS”3用户4“HTML,java,php”4用户5“Hadoop,PHP,HDFS”< /Cord>什么是错误的?code>df1=df['skills'].str.get_dummies(',')
不起作用?