如何重塑数据成为python中的一个热门编码器?
我是python中的一个noob。这里我有一个问题,关于如何在python中将数据重塑为一个热编码器。 userid中的数字可重复的数据如下:如何重塑数据成为python中的一个热门编码器?,python,data-cleaning,one-hot-encoding,Python,Data Cleaning,One Hot Encoding,我是python中的一个noob。这里我有一个问题,关于如何在python中将数据重塑为一个热编码器。 userid中的数字可重复的数据如下: userid firstlogin 15605720 2017/4/20 0:00 24537631 2017/4/20 0:00 34012219 2017/4/20 0:00 …… 32972232 2017/5/20 23:59 25698417 2017/5/20 23:59 31837935 2017/5/
userid firstlogin
15605720 2017/4/20 0:00
24537631 2017/4/20 0:00
34012219 2017/4/20 0:00
……
32972232 2017/5/20 23:59
25698417 2017/5/20 23:59
31837935 2017/5/20 23:59
34092811 2017/5/20 23:59
userid 2017/4/20 2017/4/21 ……
25181024 1 0
21631446 1 1
31784326 0 1
32258942 1 1
12840021 1 1
32709432 1 1
……
我想将其转换为一个热编码器,如下所示:
userid firstlogin
15605720 2017/4/20 0:00
24537631 2017/4/20 0:00
34012219 2017/4/20 0:00
……
32972232 2017/5/20 23:59
25698417 2017/5/20 23:59
31837935 2017/5/20 23:59
34092811 2017/5/20 23:59
userid 2017/4/20 2017/4/21 ……
25181024 1 0
21631446 1 1
31784326 0 1
32258942 1 1
12840021 1 1
32709432 1 1
……
最重要的是,我应该学习哪种功能或方法来处理这个问题。非常感谢 第一步是从firstlogin中提取日期部分。然后将其转换为object,然后使用pivot创建虚拟变量
oh['dt']=oh['firstlogin'].dt.date
oh['dummies'] = 1
oh.pivot(index='userid', columns='dt', values='dummies')
一般来说,你应该分享你所取得的进展,并描述瓶颈。如果没有这一点,专家们将不会作出回应,这可能是迄今为止没有回应的原因