Python 预测在线学生成绩的时间序列模型?

Python 预测在线学生成绩的时间序列模型?,python,pandas,scikit-learn,time-series,forecasting,Python,Pandas,Scikit Learn,Time Series,Forecasting,我有一个数据集,包含在线学生的日常活动(花费的时间、观看的视频等)。根据这些数据,我想预测每个学生是否会通过考试。到目前为止,我一直将其视为一个分类问题,每周训练一个模型,包括迄今为止的学生活动及其最终结果 这个模型运行得很好,但它忽略了随时间变化的行为。我感兴趣的是做一些时间序列分析,模型考虑到每个学生随时间变化的所有数据点,以做出最终预测 我一直在研究的时间序列模型旨在预测未来时间步中人口的特定指标(需求、收入等)。在我的例子中,我对聚合的时间步指标不太感兴趣,而对个人的最终结果更感兴趣 换

我有一个数据集,包含在线学生的日常活动(花费的时间、观看的视频等)。根据这些数据,我想预测每个学生是否会通过考试。到目前为止,我一直将其视为一个分类问题,每周训练一个模型,包括迄今为止的学生活动及其最终结果

这个模型运行得很好,但它忽略了随时间变化的行为。我感兴趣的是做一些时间序列分析,模型考虑到每个学生随时间变化的所有数据点,以做出最终预测

我一直在研究的时间序列模型旨在预测未来时间步中人口的特定指标(需求、收入等)。在我的例子中,我对聚合的时间步指标不太感兴趣,而对个人的最终结果更感兴趣


换句话说,我的问题更多的是一个分类或回归问题,但我希望能够随着时间的推移利用每个学生的使用模式。有没有办法把两者结合起来?基本上构建一个更好的分类器,随着时间的推移理解模式。

查看
fbprophet
模块。这可以将时间序列分为趋势、季节性和噪声等组成部分。该模块最初是为web流量开发的

您可以通过构造其他变量,以多种方式将其纳入回归模型,例如:

  • 期初趋势与期末趋势之比
  • 每周季节模式的大小
  • 白噪声序列的方差
  • 等等

并不是说这些构造变量中的任何一个在您的模型中都是重要的,但这正是我要尝试的类型。您可以在根本不做任何复杂的时间序列模型的情况下构建其中一些变量,例如,课程开始时观看视频的时间与课程结束时观看视频的时间之比可以在excel中计算

查看
fbprophet
模块。这可以将时间序列分为趋势、季节性和噪声等组成部分。该模块最初是为web流量开发的

您可以通过构造其他变量,以多种方式将其纳入回归模型,例如:

  • 期初趋势与期末趋势之比
  • 每周季节模式的大小
  • 白噪声序列的方差
  • 等等

并不是说这些构造变量中的任何一个在您的模型中都是重要的,但这正是我要尝试的类型。您可以在根本不做任何复杂的时间序列模型的情况下构建其中一些变量,例如,课程开始时观看视频的时间与课程结束时观看视频的时间之比可以在excel中计算

广义而言,您有两种选择:

  • 为您的功能创建时间装箱聚合,以帮助它捕获时间依赖关系。您还可以使用tsfresh之类的工具从时间序列自动生成功能

  • 使用多元时间序列模型。您可以尝试RNN或VAR(示例)


  • 大体而言,您有两种选择:

  • 为您的功能创建时间装箱聚合,以帮助它捕获时间依赖关系。您还可以使用tsfresh之类的工具从时间序列自动生成功能

  • 使用多元时间序列模型。您可以尝试RNN或VAR(示例)