python中的时间序列预测
我有一个包含300行和4列的数据集:日期、小时、计数(这一小时在电视上发布了多少广告)、访问量(这一小时内进行了多少次访问)。以下是数据示例: 如果我想测试电视广告对网站访问量的影响,我是否应该将其视为一个时间序列,并以回归为例?在这种情况下,输入表应该是什么样子?我知道我必须将日期分为日和月,但如果我的y是访问次数,如何处理计数列,保持不变?python中的时间序列预测,python,time-series,Python,Time Series,我有一个包含300行和4列的数据集:日期、小时、计数(这一小时在电视上发布了多少广告)、访问量(这一小时内进行了多少次访问)。以下是数据示例: 如果我想测试电视广告对网站访问量的影响,我是否应该将其视为一个时间序列,并以回归为例?在这种情况下,输入表应该是什么样子?我知道我必须将日期分为日和月,但如果我的y是访问次数,如何处理计数列,保持不变? 谢谢为了避免单输入单输出回归模型的情况,您可以使用小时数和计数作为输入并预测访问量。 我不知道小时的格式是什么,如果是12小时格式,则在将其输入模型之
谢谢为了避免单输入单输出回归模型的情况,您可以使用小时数和计数作为输入并预测访问量。
我不知道小时的格式是什么,如果是12小时格式,则在将其输入模型之前将其转换为24小时格式。如果要预测时间序列中的下一个日期和小时,回归模型或经典时间序列模型(如ARIMA、ARMA、指数平滑)将非常有用 但是,由于您需要预测tv spot的有效性,我建议使用python中的
tsfresh
库,基于计数生成特性以消除时间效应,并使用机器学习模型进行预测,例如SVR
或梯度增强
在你的问题中:
from tsfresh import extract_features
extracted_features = extract_features(df,
column_id="Hour",
column_kind=None,
column_value="Counts",
column_sort="time")
因此,您的目标表将是:
Hour Feature_1 Feature_2 ... Visits(Avg)
0 min(Counts) max(Counts) ... mean(Visits)
1 min(Counts) max(Counts) ... mean(Visits)
2 min(Counts) max(Counts) ... mean(Visits)
min()
和max()
只是示例功能,tsfresh
可以提取许多其他功能。访问了解更多信息您只有一个输入和一个输出,只需根据访问量绘制计数,它将显示计数如何影响访问量。你为什么要把它复杂化?这是我学习的任务,命令指示我应该使用模型。