如何重塑数据成为python中的一个热门编码器?

如何重塑数据成为python中的一个热门编码器?,python,data-cleaning,one-hot-encoding,Python,Data Cleaning,One Hot Encoding,我是python中的一个noob。这里我有一个问题,关于如何在python中将数据重塑为一个热编码器。 userid中的数字可重复的数据如下: userid firstlogin 15605720 2017/4/20 0:00 24537631 2017/4/20 0:00 34012219 2017/4/20 0:00 …… 32972232 2017/5/20 23:59 25698417 2017/5/20 23:59 31837935 2017/5/

我是python中的一个noob。这里我有一个问题,关于如何在python中将数据重塑为一个热编码器。 userid中的数字可重复的数据如下:

userid  firstlogin
15605720    2017/4/20 0:00
24537631    2017/4/20 0:00
34012219    2017/4/20 0:00
……
32972232    2017/5/20 23:59
25698417    2017/5/20 23:59
31837935    2017/5/20 23:59
34092811    2017/5/20 23:59
userid  2017/4/20   2017/4/21   ……
25181024    1   0
21631446    1   1
31784326    0   1
32258942    1   1
12840021    1   1
32709432    1   1
……
我想将其转换为一个热编码器,如下所示:

userid  firstlogin
15605720    2017/4/20 0:00
24537631    2017/4/20 0:00
34012219    2017/4/20 0:00
……
32972232    2017/5/20 23:59
25698417    2017/5/20 23:59
31837935    2017/5/20 23:59
34092811    2017/5/20 23:59
userid  2017/4/20   2017/4/21   ……
25181024    1   0
21631446    1   1
31784326    0   1
32258942    1   1
12840021    1   1
32709432    1   1
……

最重要的是,我应该学习哪种功能或方法来处理这个问题。非常感谢

第一步是从firstlogin中提取日期部分。然后将其转换为object,然后使用pivot创建虚拟变量

oh['dt']=oh['firstlogin'].dt.date
oh['dummies'] = 1
oh.pivot(index='userid', columns='dt', values='dummies')
一般来说,你应该分享你所取得的进展,并描述瓶颈。如果没有这一点,专家们将不会作出回应,这可能是迄今为止没有回应的原因