Python 2.7 在Python中将这个单词DataFrame转换为零一矩阵格式的DataFrame
要将用户Id和技能数据帧矩阵转换为零一数据帧矩阵格式用户及其相应技能 输入数据帧Python 2.7 在Python中将这个单词DataFrame转换为零一矩阵格式的DataFrame,python-2.7,pandas,dataframe,sklearn-pandas,Python 2.7,Pandas,Dataframe,Sklearn Pandas,要将用户Id和技能数据帧矩阵转换为零一数据帧矩阵格式用户及其相应技能 输入数据帧 user_Id skills 0 user1 [java, hdfs, hadoop] 1 user2 [python, c++, c] 2 user3 [hadoop, java, hdfs] 3 user4 [h
user_Id skills
0 user1 [java, hdfs, hadoop]
1 user2 [python, c++, c]
2 user3 [hadoop, java, hdfs]
3 user4 [html, java, php]
4 user5 [hadoop, php, hdfs]
user_Id java c c++ hadoop hdfs python html php
user1 1 0 0 1 1 0 0 0
user2 0 1 1 0 0 1 0 0
user3 1 0 0 1 1 0 0 0
user4 1 0 0 0 0 0 1 1
user5 0 0 0 1 1 0 0 1
期望输出数据帧
user_Id skills
0 user1 [java, hdfs, hadoop]
1 user2 [python, c++, c]
2 user3 [hadoop, java, hdfs]
3 user4 [html, java, php]
4 user5 [hadoop, php, hdfs]
user_Id java c c++ hadoop hdfs python html php
user1 1 0 0 1 1 0 0 0
user2 0 1 1 0 0 1 0 0
user3 1 0 0 1 1 0 0 0
user4 1 0 0 0 0 0 1 1
user5 0 0 0 1 1 0 0 1
如果需要,您可以将创建的新的DataFrame
列表转换为str
(否则省略),然后删除[]
,并使用:
在
栏中,技能
是列表
?非常感谢!!它对我有用,而且是非常优化的解决方案:)那么df.columns=df.columns.str.encode(“utf-8”)
?不,但这行对我有用df1.columns=df1.columns.str.strip(“u”)
,但同样的解决方案不适用于这个问题@jezrael用户Id技能0用户1“java,hdfs,hadoop”1用户2“Python,C++,C”2用户3“Hadoop,java,HDFS”3用户4“HTML,java,php”4用户5“Hadoop,PHP,HDFS”< /Cord>什么是错误的?code>df1=df['skills'].str.get_dummies(',')
不起作用?