Machine learning 神经网络:如何将用户行为规范化为输入

Machine learning 神经网络:如何将用户行为规范化为输入,machine-learning,neural-network,normalization,modeling,Machine Learning,Neural Network,Normalization,Modeling,我正在从事一个神经网络项目,它读取服务器日志文件,并尝试将用户分为候选买家和随机浏览者两类 日志文件看起来像 timestamp, user_id, event, page 1454973364, user_A, enter, http://some_url/?page=dashboard 1454973365, user_A, enter, http://some_url/?page=search&q=tablet 1454973366, user_A, enter, http://s

我正在从事一个神经网络项目,它读取服务器日志文件,并尝试将用户分为
候选买家
随机浏览者
两类

日志文件看起来像

timestamp, user_id, event, page
1454973364, user_A, enter, http://some_url/?page=dashboard
1454973365, user_A, enter, http://some_url/?page=search&q=tablet
1454973366, user_A, enter, http://some_url/?page=faq&item=1234
1454973366, user_B, enter, http://some_url/?page=about_us
1454973366, user_A, enter, http://some_url/?page=order_placed
...
1454973368, user_A, exit, http://some_url/?page=order_placed
1454973368, user_B, exit, http://some_url/?page=about_us
所有像
user\u A
这样的用户都应该积极地定位为
候选买家
user\u B
应该消极地定位为
随机浏览者
。当然,我的项目的目标是在用户点击转换页面之前做出预测

  • 将这样一系列事件建模为输入的最佳方法是什么

  • 一个更一般的问题。从日志数据中,我们可以获得有关用户如何参与我们网站的信息(拖动小部件、单击链接、向下/向上滚动、在页面上花费的时间等)。考虑到一系列这样的操作,机器学习中将它们建模为输入的一般方法是什么


  • 您是否希望不断为您的模型提供新数据?新的点击、滚动、搜索等。?我是否正确理解,最初您对用户一无所知,只有通过与网站的交互,您才能获得允许您进行分类的功能?其中一种方法是尝试根据最后N个操作预测每个用户的类别。您必须在其中找到合适的N。这意味着对于每个用户,您必须向网络N日志项提供数据。这会适合您的应用程序吗?@LukaszTracewski我会说我不会不断地向模型提供新数据。我已经有大量的数据,我将根据我已有的数据来训练模型。@Mido是的,它适合我的应用程序。问题是我不确定如何将一系列动作量化为神经网络输入。@SpicyrentHouse一种方法是,如果你有3个动作(拖动、单击、滚动),那么每个动作都可以作为神经网络的输入。如果该操作发生,则该输入应为1,否则为0。要表示多个日志条目,必须重复此操作。对于时间输入,您可以找到一种方法将其规格化为介于0和1之间的值。是否要不断向模型提供新数据?新的点击、滚动、搜索等。?我是否正确理解,最初您对用户一无所知,只有通过与网站的交互,您才能获得允许您进行分类的功能?其中一种方法是尝试根据最后N个操作预测每个用户的类别。您必须在其中找到合适的N。这意味着对于每个用户,您必须向网络N日志项提供数据。这会适合您的应用程序吗?@LukaszTracewski我会说我不会不断地向模型提供新数据。我已经有大量的数据,我将根据我已有的数据来训练模型。@Mido是的,它适合我的应用程序。问题是我不确定如何将一系列动作量化为神经网络输入。@SpicyrentHouse一种方法是,如果你有3个动作(拖动、单击、滚动),那么每个动作都可以作为神经网络的输入。如果该操作发生,则该输入应为1,否则为0。要表示多个日志条目,必须重复此操作。对于时间输入,可以找到一种方法将其规格化为0到1之间的值。