python中的时间序列预测

python中的时间序列预测,python,time-series,Python,Time Series,我有一个包含300行和4列的数据集:日期、小时、计数(这一小时在电视上发布了多少广告)、访问量(这一小时内进行了多少次访问)。以下是数据示例: 如果我想测试电视广告对网站访问量的影响,我是否应该将其视为一个时间序列,并以回归为例?在这种情况下,输入表应该是什么样子?我知道我必须将日期分为日和月,但如果我的y是访问次数,如何处理计数列,保持不变? 谢谢为了避免单输入单输出回归模型的情况,您可以使用小时数和计数作为输入并预测访问量。 我不知道小时的格式是什么,如果是12小时格式,则在将其输入模型之

我有一个包含300行和4列的数据集:日期、小时、计数(这一小时在电视上发布了多少广告)、访问量(这一小时内进行了多少次访问)。以下是数据示例:

如果我想测试电视广告对网站访问量的影响,我是否应该将其视为一个时间序列,并以回归为例?在这种情况下,输入表应该是什么样子?我知道我必须将日期分为日和月,但如果我的y是访问次数,如何处理计数列,保持不变?
谢谢

为了避免单输入单输出回归模型的情况,您可以使用小时数和计数作为输入并预测访问量。
我不知道小时的格式是什么,如果是12小时格式,则在将其输入模型之前将其转换为24小时格式。

如果要预测时间序列中的下一个日期和小时,回归模型或经典时间序列模型(如ARIMA、ARMA、指数平滑)将非常有用

但是,由于您需要预测tv spot的有效性,我建议使用python中的
tsfresh
库,基于计数生成特性以消除时间效应,并使用机器学习模型进行预测,例如
SVR
梯度增强

在你的问题中:

from tsfresh import extract_features
extracted_features = extract_features(df,
                                      column_id="Hour",
                                      column_kind=None,
                                      column_value="Counts",
                                      column_sort="time")
因此,您的目标表将是:

Hour    Feature_1     Feature_2    ...    Visits(Avg)
0      min(Counts)    max(Counts)  ...    mean(Visits)
1      min(Counts)    max(Counts)  ...    mean(Visits)
2      min(Counts)    max(Counts)  ...    mean(Visits)

min()
max()
只是示例功能,
tsfresh
可以提取许多其他功能。访问了解更多信息

您只有一个输入和一个输出,只需根据访问量绘制计数,它将显示计数如何影响访问量。你为什么要把它复杂化?这是我学习的任务,命令指示我应该使用模型。