Machine learning 基于web登录时间戳的时间序列预测

Machine learning 基于web登录时间戳的时间序列预测,machine-learning,time-series,regression,data-science,Machine Learning,Time Series,Regression,Data Science,如果我必须建立一个时间序列预测模型,而我所拥有的只是一个用户登录站点时的时间戳序列,那么你如何建模呢 下面是数据的前几行。我把这当作熊猫系列 0 2012-03-01 00:05:55 1 2012-03-01 00:06:23 2 2012-03-01 00:06:52 3 2012-03-01 00:11:23 4 2012-03-01 00:12:47 5 2012-03-01 00:12:54 6 2012-03-01 00:16:14 7 2012-03

如果我必须建立一个时间序列预测模型,而我所拥有的只是一个用户登录站点时的时间戳序列,那么你如何建模呢

下面是数据的前几行。我把这当作熊猫系列

0   2012-03-01 00:05:55
1   2012-03-01 00:06:23
2   2012-03-01 00:06:52
3   2012-03-01 00:11:23
4   2012-03-01 00:12:47
5   2012-03-01 00:12:54
6   2012-03-01 00:16:14
7   2012-03-01 00:17:31
8   2012-03-01 00:21:23
9   2012-03-01 00:21:26
现在有几个问题:

1) 。当我只有时间戳,没有Y值或任何其他特性时,如何以小时为单位绘制用户行为图

2) 。建立一个适合这个时间序列的模型,并预测未来两周


没有给出其他特性或变量。每天只需登录3个月

回应第一部分。我做过类似的事情,遇到了同样的问题。我使用epoch对时间序列进行分组,并将其加载到字典中。从那时起,我就可以按小时分段处理时间序列。(数据源是json)然后可以直接使用matplotlib将其转换为panda数据框和图表。由于您的数据已经在panda中,您可以跳过数据拉取并编辑初始循环来处理原始数据。我希望这有帮助

for key in responseJson['All'].keys():
        t = time.strftime('%Y,%m,%d %H:00:00', time.gmtime(float(key) / 1000.0))
        h = responseJson['All'][key]
        word = t
        epochkey = int(time.mktime(time.strptime(t, '%Y,%m,%d %H:00:00')))

        if word not in dict:
            dict[word] = h
            epochdict[epochkey] = h
        else:
            dict[word] += h
            epochdict[epochkey] += h
然后我将其转换为熊猫数据帧:

for row in epochdict:
        if(row[0] not in data):
            data[row[0]]={}
        data[str(row[0])][str(row[2])]=round(row[3],3)

            df=DataFrame(data).T.fillna(0)
这使我能够根据时间序列绘制每小时的数据