Python 我应该如何构建tensorflow数据集,以便将其输入自定义RNN估计器

Python 我应该如何构建tensorflow数据集,以便将其输入自定义RNN估计器,python,tensorflow,rnn,sequential,Python,Tensorflow,Rnn,Sequential,我正在尝试使用RNN来估计我网站上的客户是否会根据他们的点击行为购买物品。因此,数据集看起来像: session_id page_type event since_previous_click (s) will_buy 1 search SelectCountry null 0 1 search SelectCountry 2

我正在尝试使用RNN来估计我网站上的客户是否会根据他们的点击行为购买物品。因此,数据集看起来像:

session_id  page_type   event            since_previous_click (s)   will_buy
1           search      SelectCountry    null                        0
1           search      SelectCountry    2                           0
1           search      SortResults      4                           0
1           product     SelectColor      20                          0
2           search      SelectCountry    null                        1
2           search      SortResults      10                          1
2           product     SelectSize       5                           1
2           product     SelectColor      23                          1
2           inmarket    EnterName        8                           1
2           inmarket    Booked           34                          1

所以“will_buy”是标签,页面类型、事件和自上次点击是输入功能。然而,我的问题是,我不知道如何组织我的工作。我知道维度应该是[#数据点,#时间步长,#特征],其中时间步长的数量应该填充,因为它们的长度不同。但我不能从张量(或numpy数组)构造这个3D对象,因为有多个数据类型(string和int32)。有什么帮助吗?

将页面类型和事件转换为一个热向量。然后,您的所有数据都将是int32。

这可能会帮助您回答一些问题:)