Python 多个n数的时间序列数据预测

Python 多个n数的时间序列数据预测,python,machine-learning,time-series,Python,Machine Learning,Time Series,我正在研究时间序列数据 如果查看到目前为止使用示例运行的时间序列数据,它们都类似地只有两列。一个是日期,一个是任意值 例如,在股票价格上涨预测的情况下,我们预测“单一”股票 如果是这样,你能在时间序列数据分析中同时预测多只股票吗 例如,在受试者服用影响肝脏水平的药物后,他们获得了迄今为止的肝脏计数数据。基于此,我想尝试预测未来肝脏水平上升或下降的时间点。此时,我需要同时预测几个患者,而不是一个患者。在这种情况下,如何指定数据集 是否可以通过添加一列来添加标签?还是我没有真正理解时间序列数据分析的

我正在研究时间序列数据

如果查看到目前为止使用示例运行的时间序列数据,它们都类似地只有两列。一个是日期,一个是任意值

例如,在股票价格上涨预测的情况下,我们预测“单一”股票

如果是这样,你能在时间序列数据分析中同时预测多只股票吗

例如,在受试者服用影响肝脏水平的药物后,他们获得了迄今为止的肝脏计数数据。基于此,我想尝试预测未来肝脏水平上升或下降的时间点。此时,我需要同时预测几个患者,而不是一个患者。在这种情况下,如何指定数据集

是否可以通过添加一列来添加标签?还是我没有真正理解时间序列数据分析的本质


如果有人知道任何相关信息,如果您能给我提供建议或给我一个参考网站,我将不胜感激。

您应该分别为每位患者进行预测。你可能不希望对其中一名患者的预测因其他患者同时发生的情况而有所不同

机器学习不仅仅是向模型提供数据并返回结果,你还必须思考模型,它的输入和输出应该是什么。对于时间序列,您可能会将前几天在患者身上观察到的情况作为输入,并尝试预测下一天会发生什么。对于一个患者,您不需要其他患者的数据,如果您将其提供给您的模型,它将尝试使用它并从训练数据中捕获一些噪声,这不是您想要的

但是,由于您可以预期每个患者都有类似的行为,因此可以为所有患者构建一个模型,而不是为每个患者构建一个模型。典型的输入形式如下:

[X(t-k,i),X(t-k+1,i),…,X(t-1,i)]

其中X(t,i)是患者i在时间t的观察值,用于预测X(t,i)。使用所有患者的数据训练您的模型

当你举一个医学例子时,要知道如果你有一些协变量,比如病人的体重或性别,你可以将他们包括在你的模型中,以捕捉他们的个人特征。在这种情况下,预测X(t,i)的模型输入为:

[X(t-k,i),X(t-k+1,i),…,X(t-1,i),C1(i),…,Cp(i)]


其中C1(i)…Cp(i)是患者的协变量。如果你没有这些协变量,这不是一个问题,它们在某些情况下可以改善结果。请注意,并非所有协变量都有用。

谢谢您的回答!这就是我所理解的吗?1.在时间序列数据模型中,不可能通过标记患者的数据集来立即训练模型。2.因此,每个患者都应该使用每个数据集进行培训,并查看结果。不完全如此。您可以立即训练模型,但在一次“观察”中,您只提供一名患者的数据。