Python 哪种ML模型最适合于时间序列活动日志数据来预测客户保留?

Python 哪种ML模型最适合于时间序列活动日志数据来预测客户保留?,python,machine-learning,data-science,Python,Machine Learning,Data Science,我有客户活动数据,如登录次数、在网站上花费的时间、注册的设备和更改的策略。数据是按天组织的。i、 e客户在特定日期的活动。 ML模型应该能够基于此活动预测是否保留客户。 理想情况下,模型应该输出bool值或保留机会的百分比 我应该研究哪些ML模型? 如有任何建议,我们将不胜感激。“哪种ML型号最适合 不幸的是,“没有免费午餐”定理指出答案永远是:“视情况而定” 不过幸运的是,客户保留模型得到了很好的研究,通常被表述为一个简单的分类问题。因此,您可以尝试一些简单的算法,例如: 回归分析:logis

我有客户活动数据,如登录次数、在网站上花费的时间、注册的设备和更改的策略。数据是按天组织的。i、 e客户在特定日期的活动。 ML模型应该能够基于此活动预测是否保留客户。 理想情况下,模型应该输出bool值或保留机会的百分比

我应该研究哪些ML模型? 如有任何建议,我们将不胜感激。

“哪种ML型号最适合

不幸的是,“没有免费午餐”定理指出答案永远是:“视情况而定”

不过幸运的是,客户保留模型得到了很好的研究,通常被表述为一个简单的分类问题。因此,您可以尝试一些简单的算法,例如:

  • 回归分析:logistic回归
  • 决策树-购物车
  • 贝叶斯算法:天真的贝叶斯
  • 支持向量机
  • 基于实例的学习:k-最近邻
  • 集成学习:Ada Boost、随机梯度Boost和随机森林
  • 人工神经网络:多层感知器
  • 线性判别分析

  • 时间序列预测

    在时间序列数据的经典统计处理中,对未来进行预测被称为外推

    更多的现代领域关注这个主题,并将其称为时间序列预测

    预测包括采用适合历史数据的模型,并使用它们预测未来的观测结果

    描述性模型可以用于未来(即平滑或消除噪声),它们只寻求最好地描述数据

    预测的一个重要区别是,未来完全不可用,只能根据已经发生的事情进行估计

    如果您的数据具有某种趋势或季节性,您可能希望平滑数据并使用以下任一算法:

    1。移动平均算法

    2。自动回归

    3。ARIMA(自回归综合移动平均)模型

    ARIMA模型是移动平均和自回归算法的结合


    我强烈建议您阅读这篇关于使用ARIMA模型进行时间序列预测的精彩教程/博客:

    问这个问题的地方不对,请访问回归将不是一个好的选择,因为在时间序列中,只有一个变量与时间序列相对应。例:年销售额等这是事实,但客户保留是一个典型的分类问题。因此,在我的建议中,您应该首先将数据转换为更适合分类的非时间序列格式,例如,尽管分类等。是的,在这种情况下,它将保持良好。但问题在于时间序列预测。