Machine learning 神经网络：如何将用户行为规范化为输入_Machine Learning_Neural Network_Normalization_Modeling

Machine learning 神经网络：如何将用户行为规范化为输入

machine-learning neural-network

Machine learning 神经网络：如何将用户行为规范化为输入,machine-learning,neural-network,normalization,modeling,Machine Learning,Neural Network,Normalization,Modeling,我正在从事一个神经网络项目，它读取服务器日志文件，并尝试将用户分为候选买家和随机浏览者两类日志文件看起来像 timestamp, user_id, event, page 1454973364, user_A, enter, http://some_url/?page=dashboard 1454973365, user_A, enter, http://some_url/?page=search&q=tablet 1454973366, user_A, enter, http://s

我正在从事一个神经网络项目，它读取服务器日志文件，并尝试将用户分为

候选买家

和

随机浏览者

两类

日志文件看起来像

timestamp, user_id, event, page
1454973364, user_A, enter, http://some_url/?page=dashboard
1454973365, user_A, enter, http://some_url/?page=search&q=tablet
1454973366, user_A, enter, http://some_url/?page=faq&item=1234
1454973366, user_B, enter, http://some_url/?page=about_us
1454973366, user_A, enter, http://some_url/?page=order_placed
...
1454973368, user_A, exit, http://some_url/?page=order_placed
1454973368, user_B, exit, http://some_url/?page=about_us

所有像

user\u A

这样的用户都应该积极地定位为
候选买家
，
user\u B
应该消极地定位为
随机浏览者
。当然，我的项目的目标是在用户点击转换页面之前做出预测

将这样一系列事件建模为输入的最佳方法是什么

一个更一般的问题。从日志数据中，我们可以获得有关用户如何参与我们网站的信息（拖动小部件、单击链接、向下/向上滚动、在页面上花费的时间等）。考虑到一系列这样的操作，机器学习中将它们建模为输入的一般方法是什么

您是否希望不断为您的模型提供新数据？新的点击、滚动、搜索等。？我是否正确理解，最初您对用户一无所知，只有通过与网站的交互，您才能获得允许您进行分类的功能？其中一种方法是尝试根据最后N个操作预测每个用户的类别。您必须在其中找到合适的N。这意味着对于每个用户，您必须向网络N日志项提供数据。这会适合您的应用程序吗？@LukaszTracewski我会说我不会不断地向模型提供新数据。我已经有大量的数据，我将根据我已有的数据来训练模型。@Mido是的，它适合我的应用程序。问题是我不确定如何将一系列动作量化为神经网络输入。@SpicyrentHouse一种方法是，如果你有3个动作（拖动、单击、滚动），那么每个动作都可以作为神经网络的输入。如果该操作发生，则该输入应为1，否则为0。要表示多个日志条目，必须重复此操作。对于时间输入，您可以找到一种方法将其规格化为介于0和1之间的值。是否要不断向模型提供新数据？新的点击、滚动、搜索等。？我是否正确理解，最初您对用户一无所知，只有通过与网站的交互，您才能获得允许您进行分类的功能？其中一种方法是尝试根据最后N个操作预测每个用户的类别。您必须在其中找到合适的N。这意味着对于每个用户，您必须向网络N日志项提供数据。这会适合您的应用程序吗？@LukaszTracewski我会说我不会不断地向模型提供新数据。我已经有大量的数据，我将根据我已有的数据来训练模型。@Mido是的，它适合我的应用程序。问题是我不确定如何将一系列动作量化为神经网络输入。@SpicyrentHouse一种方法是，如果你有3个动作（拖动、单击、滚动），那么每个动作都可以作为神经网络的输入。如果该操作发生，则该输入应为1，否则为0。要表示多个日志条目，必须重复此操作。对于时间输入，可以找到一种方法将其规格化为0到1之间的值。